استفاده از تکنولوژی OCR در مدیریت اسناد کتابخانه مجلس/ تبدیل بیش از1 میلیون و500 هزار برگ از اسناد مجلس به متن قابل جستوجو
کتابخانه مجلس شورای اسلامی با بهرهگیری از تکنولوژی OCR (شناخت نوری کاراکترها) گامی بلند در جهت مدیریت بهینه اسناد برداشته و تاکنون بیش از 1میلیون و 500 هزار برگ از اسناد مجلس که فهرستنویسی نشده است و دسترسی به محتوای اطلاعاتی برگ به برگ اسناد امکانپذیر نیست، با این تکنولوژ به متن قابل جستوجو تبدیل شده است.
به گزارش خبرگزاری خانه ملت، کتابخانه مجلس شورای اسلامی با بهرهگیری از تکنولوژی OCR (شناخت نوری کاراکترها) گامی بلند در جهت مدیریت بهینه اسناد برداشته است. این تکنولوژی پیشرفته به کتابخانه مجلس امکان میدهد تا متون موجود در تصاویر و اسناد کاغذی را به متون قابل جستجو و ویرایش تبدیل کرده و دسترسی به محتوای اطلاعاتی آنها را تسهیل کند.
ندا شهماری، مدیر مرکز اسناد کتابخانه مجلس شورای اسلامی، در این باره گفت: با استفاده از تکنولوژیOCR، تصاویر اسناد مختلفی از جمله مصوبات، لوایح، صورت جلسات و مکاتبات مجلس در سیستمهای مدیریت مستندات ذخیره میشوند. این فرآیند نه تنها به حفاظت از اسناد مهم کمک میکند، بلکه جستجو و بازیابی اطلاعات را نیز بسیار آسانتر میسازد.
وی افزود: تاکنون بیش از یک میلیون و پانصد هزار برگ از اسناد مجلس شورای اسلامی که فهرستنویسی نشده است و دسترسی به محتوای اطلاعاتی برگ به برگ اسناد امکانپذیر نیست، با تکنولوژی OCR به متن قابل جستجو تبدیل شده است.
شهماری گفت: از جمله مزایای برجسته استفاده از OCR میتوان به صرفهجویی در زمان، کاهش خطاهای انسانی و افزایش بهرهوری اشاره کرد. فرآیند دیجیتالسازی و جستجو در اسناد به طور قابل توجهی سریعتر از روشهای سنتی است و با اتکا به تکنولوژی هوش مصنوعی، دقت استخراج متون افزایش مییابد و خطاهای احتمالی ناشی از ورود دستی اطلاعات کاهش پیدا میکند.
مدیر مرکز اسناد کتابخانه مجلس ادامه داد: استفاده از OCR در کتابخانه مجلس شورای اسلامی نمونهای بارز از بهرهگیری از فناوریهای نوین برای بهبود فرآیندهای کاری و مدیریت بهینه اطلاعات است.
شهماری با اشاره به پیشرفتهای روزافزون در زمینه هوش مصنوعی و یادگیری ماشینی خاطرنشان کرد: انتظار میرود که دقت و کارایی تکنولوژی OCR در آینده افزایش یابد و کتابخانه مجلس شورای اسلامی بتواند بهرهوری بیشتری از این تکنولوژی را تجربه کند./
پایان پیام