Nhận dạng văn bản từ hình ảnh và tệp PDF, có hỗ trợ Tiếng Việt với NewOCR

Giới thiệu về NewOCR:

NewOCR là một dịch vụ hỗ trợ chuyển đổi định dạng tệp văn bản trực tuyến hoàn toàn miễn phí với nhiều định dạng file phổ biến như JPEG, PNG, GIF, BMP, TIFF, PDF hay DjVu. Điểm đặc biệt nhất của công cụ này đến từ công nghệ nhận dạng ký tự quang học (OCR), có thể xác định các ký tự một cách chính xác trong nhiều môi trường khác nhau mà nhiều phần mềm hay công cụ khác không thể làm được (hoặc cho ra kết quả thiếu chính xác hơn).
Không chỉ vậy, nhà phát triển tích hợp bộ hỗ trợ ngôn ngữ với hơn 120 ngôn ngữ trên thế giới, cho phép sao chép kết quả hoặc lưu lại dưới các định dạng file có thể chỉnh sửa như .TXT, .DOC hay .PDF v.v...

Hướng dẫn sử dụng nhanh:

Để sử dụng công cụ này cũng khá đơn giản, bạn chỉ cần chuẩn bị trước tệp tài liệu muốn chuyển đổi nội dung thành dạng văn bản có thể chỉnh sửa và upload lên trang chủ của NewOCR.
Nhận dạng văn bản từ hình ảnh và tệp PDF, có hỗ trợ Tiếng Việt với NewOCR
Chọn ngôn ngữ trong tệp và hình thức tải lên (bao gồm chỉ tải lên và tải lên + chuyển đổi văn bản)
Sau khi quá trình tải lên và quét nội dung từ tệp hoàn tất, NewOCR sẽ hiển thị kết quả (văn bản) ngay phía dưới giao diện upload để bạn sao chép hoặc lưu dưới dạng file dễ dàng chỉnh sửa hơn.
TECHRUM.VN
Nguồn : http://www.techrum.vn/threads/newocr-cong-cu-min-phi-giup-nhn-dang-van-ban-t-hinh-anh-va-tp-pdf-co-h-tr-ting-vit.201629/