4 công cụ OCR trực tuyến miễn phí được đưa vào thử nghiệm cuối cùng

4 công cụ OCR trực tuyến miễn phí được đưa vào thử nghiệm cuối cùng

Nếu bạn muốn chuyển đổi bất kỳ văn bản in nào thành văn bản kỹ thuật số mà bạn có thể sao chép, dán, chỉnh sửa và tìm kiếm, bạn sẽ cần sử dụng máy quét Nhận dạng ký tự quang học (OCR).





Khi bạn chọn quét hoặc chụp ảnh tài liệu, tài liệu này sẽ được lưu ở định dạng như JPEG hoặc PDF. Phần mềm OCR sau đó có thể nhận dạng các chữ cái và số trong các tài liệu này và chuyển đổi chúng thành một tệp PDF có thể tìm kiếm hoặc thành một tệp mà bạn có thể chỉnh sửa trong các chương trình như Microsoft Word.





Vấn đề là, một số máy quét OCR hoạt động tốt hơn nhiều so với những máy khác, với điều tốt nhất là khá nặng về ví.





Ví dụ, Omnipage18 có giá 150 đô la, nhưng đặc biệt tốt trong việc nhận dạng các ngôn ngữ khác nhau. Adobe Acrobat Pro DC có giá 400 đô la nhưng có độ chính xác đáng kinh ngạc. ABBYY FineReader có giá 150 đô la, nhưng rất tuyệt vời trong việc chuyển đổi các tài liệu như tạp chí và tài liệu quảng cáo thành văn bản có thể tìm kiếm được. Chúng tôi sẽ kiểm tra dịch vụ trực tuyến của ABBYY sau trong bài viết này.

Tuy nhiên, nếu bạn đang theo đuổi các lựa chọn thay thế miễn phí mà bạn có thể Tải xuống và sử dụng trên Windows hoặc OS X, bạn nên dùng thử các Công cụ OCR này. Nhưng nếu bạn muốn sử dụng miễn phí, Trực tuyến Công cụ OCR, hãy tiếp tục đọc, vì chúng tôi đã thử một vài công cụ hàng đầu, với kết quả bên dưới.



Các bài kiểm tra

Có vẻ như hầu hết mọi người hiện sử dụng điện thoại thông minh của họ để quét chúng, tôi quyết định sử dụng Ứng dụng có thể quét của Evernote (Miễn phí trên iOS và Android). Tôi đã xem trang đầu tiên của Richard Dawkin's Leo núi Không thể cải thiện , để xem chúng tôi có thể nhận được kết quả gì với định dạng rất cơ bản. Tôi cũng đã quét một trang của Tim Ferriss ' Đầu bếp 4 giờ để thử các máy quét với một số định dạng phức tạp hơn một chút. Tôi đã lưu từng tệp này dưới dạng PDF.

Những tài liệu này sau đó được chạy qua một số công cụ OCR trực tuyến được cho là tốt nhất để xem chúng hoạt động tốt như thế nào.





OCR trực tuyến miễn phí [Không còn khả dụng]

Thật hạnh phúc, không cần đăng ký để sử dụng OCR Trực tuyến Miễn phí. Và tôi đã vô cùng ấn tượng khi thấy họ tuyên bố giữ nguyên định dạng và bố cục tài liệu của tôi.

Trang web tuyên bố có thể hỗ trợ PDF, GIF, BMP, JPEG, TIFF và PNG làm đầu vào. Đầu ra có thể là DOC, tài liệu văn bản PDF, RTF và TXT. Rất tiếc, tôi không thể tìm hiểu xem chúng có giới hạn kích thước tệp hay không.





Tài liệu cơ bản sang PDF

Đã chuyển đổi hoàn toàn tuyệt đối. Không còn nhiều điều để nói nữa! Chúng tôi đi đến một hết sức khởi đầu tốt.

Tài liệu cơ bản tới DOC

Các từ thực tế dường như đã chuyển đổi hoàn hảo, ngoại trừ 'ount' từ 'Mount Rushmore' bằng cách nào đó sẽ AWOL. Tuy nhiên, việc định dạng lại là một câu chuyện khác. Nhiều dấu phẩy đã được thay thế bằng dấu gạch dưới và các khoảng trắng ngẫu nhiên được chèn vào các điểm trong toàn bộ tài liệu. Sau đó, khi bạn thấy phần mềm cao cấp hoạt động như thế nào trong thử nghiệm này, đây không phải là một nỗ lực tồi ở tất cả .

Tài liệu phức tạp sang PDF

Tài liệu phức tạp tới DOC

Lần này, quá trình chuyển đổi chỉ diễn ra trong 10 giây, với văn bản lại được chuyển đổi với độ chính xác khoảng 95%. Có một số vấn đề về khoảng cách lạ và phần mềm gặp sự cố khi chuyển đổi phông chữ ở trên cùng bên phải của tài liệu và bỏ sót một vài ký tự ở đây và ở đó.

Nhận định

i2OCR

i2OCR đưa ra một số tuyên bố ấn tượng. Công cụ nhận dạng hơn 60 ngôn ngữ, có thể xử lý bố cục nhiều cột (bằng cách loại bỏ định dạng), không có giới hạn về kích thước tệp, có thể chuyển đổi tệp đã tải lên từ các URL. Và bạn cũng không cần phải đăng ký để sử dụng công cụ này.

Dịch vụ này hoạt động bằng cách đơn giản trích xuất văn bản từ hình ảnh của bạn, sau đó xuất ra văn bản chưa được định dạng. Bạn có thể nhanh chóng sửa bất kỳ lỗi nào trong chế độ xem song song, trước khi sao chép văn bản sang các chương trình khác hoặc tải xuống dưới dạng DOC, PDF hoặc HTML.

Lưu ý: khi tôi cố gắng tải lên tài liệu PDF của mình, những tài liệu này đã bị i2OCR từ chối, vì vậy tôi cần chuyển đổi chúng sang JPEG (bằng cách chụp ảnh màn hình của chúng, sau đó tải tệp lên).

Từ tài liệu cơ bản sang văn bản thuần túy

Văn bản phức tạp thành văn bản thuần túy

Phần lớn văn bản đã được chuyển đổi mà không có quá nhiều sai sót, ngoại trừ tiêu đề và công thức ở trên cùng bên phải, không thể đọc được đối với công cụ này. Cách các cột được chuyển đổi thành văn bản thuần túy khác xa lý tưởng. Nếu bạn muốn làm cho việc chuyển đổi này có thể thực hiện được, sẽ cần rất nhiều thời gian để sắp xếp lại các dòng thành các câu mạch lạc.

Nhận định

OCR trực tuyến

OCR trực tuyến hiện hỗ trợ 46 ngôn ngữ khác nhau và có thể chuyển đổi PDF, JPG, BMP, TIFF và GIF thành định dạng Word, Excel hoặc Văn bản thuần túy. Trang web tuyên bố 'các tài liệu được chuyển đổi trông giống hệt như bản gốc - bảng, cột và đồ họa'.

Phiên bản bạn có thể sử dụng mà không cần đăng ký cho phép bạn chuyển đổi tối đa 15 hình ảnh mỗi giờ (giới hạn 5mb). Nếu bạn đăng ký một tài khoản, bạn có thể mua nhiều trang hơn trên giới hạn này, đồng thời có thể chuyển đổi các tài liệu nhiều trang và lưu trữ ZIP.

Tài liệu cơ bản tới DOC

Tài liệu cơ bản được chuyển đổi hoàn hảo ngoài số La Mã tôi không được đón. Như trang web đã hứa, định dạng chính xác như trong sách. Kudo cho công cụ này.

Tài liệu phức tạp tới DOC

Sau khi thất vọng với các công cụ OCR trước đây trong việc chuyển đổi tài liệu phức tạp, tôi đã vô cùng ấn tượng bởi OCR Trực tuyến. Bố cục gần như hoàn hảo, như bạn có thể thấy ở trên. Mặc dù vậy, một lần nữa, công thức không được chọn quá tốt, nhưng bất kỳ sai sót nhỏ nào khác là không đáng kể.

Nhận định

Kết quả hoàn toàn tuyệt vời từ OCR Trực tuyến. Nhược điểm duy nhất mà tôi thấy là không có cách nào để tải xuống các tài liệu đã chuyển đổi dưới dạng PDF vì các định dạng đầu ra được đề cập chỉ bao gồm DOCX, XLSX và TXT.

ABBYY FineReader Online (Bản dùng thử 10 trang)

Như đã đề cập trước đó, ABBYY là một trong những công ty dẫn đầu thị trường về phần mềm OCR, có giá khoảng 150 đô la cho chương trình đầy đủ, có thể tải xuống của họ. Họ cung cấp một 10 trang dùng thử miễn phí cho công cụ trực tuyến của họ, mặc dù (yêu cầu đăng ký). Đối với đăng ký $ 5, công cụ trực tuyến của họ sẽ cho phép bạn chuyển đổi 200 trang mỗi tháng.

Các tệp được chấp nhận có thể lên đến 100mb, ở bất kỳ định dạng nào sau đây: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP và PNG. ABBYY cũng nhận dạng gần 200 ngôn ngữ. Kết quả đầu ra đặc biệt ấn tượng, với sự lựa chọn giữa DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 và EPUB.

Bạn thậm chí có thể thử một vài tính năng BETA trong thời gian dùng thử. Đầu tiên là tùy chọn dịch tài liệu của bạn sang một ngôn ngữ khác. Cách khác là xuất tài liệu đã chuyển đổi của bạn sang tài khoản lưu trữ đám mây, cho dù đó là Dropbox, Google Drive, Evernote, Microsoft OneDrive hay Box.

Tài liệu cơ bản sang DOCX

Tài liệu phức tạp sang DOCX

Sau khi chuyển đổi, có rất ít lỗi trong văn bản trong tài liệu (ngoài việc OCR phải vật lộn với phông chữ của công thức đó một lần nữa!), Nhưng định dạng vẫn còn rất nhiều điều mong muốn.

Ba cột bằng cách nào đó chiếm hai trang, với cột trung tâm chỉ một xuất hiện trên trang thứ hai. Nếu bạn thực sự muốn làm bất cứ thứ gì với tài liệu đã được chuyển đổi này, bạn sẽ phải nhổ tóc.

Tài liệu cơ bản sang PDF

Tài liệu phức tạp sang PDF

Nhận định

Kết quả cuối cùng

Nếu, giống như hầu hết mọi người, bạn chỉ muốn quét một vài bài báo trên tạp chí và một số hóa đơn gia đình, bạn sẽ không cần phải chỉnh sửa những tài liệu này. Do đó, chuyển đổi trực tiếp sang PDF sẽ phù hợp với bạn, vì bạn vẫn có thể tìm kiếm các tài liệu đó. Về điều này, Free Online OCR chắc chắn là công cụ miễn phí tốt nhất mà chúng tôi đã thử nghiệm. Điều đó đang được nói, nếu bạn sẵn sàng trả $ 5 mỗi tháng cho sự gần như hoàn hảo, ABBYY's FineReader Trực tuyến chính xác hơn một chút.

Khi nói đến việc chuyển đổi tài liệu sang DOC, chúng tôi đã không tìm ra bất kỳ giải pháp nào hoàn hảo, nhưng cho đến nay kết quả tốt nhất đến từ OCR trực tuyến . Việc chuyển đổi không hoàn hảo, nhưng tính toàn vẹn của định dạng phần lớn được giữ nguyên vẹn và sai sót là không đáng kể. Khi chúng tôi so sánh những kết quả này với sản phẩm 'cao cấp' từ ABBYY, bạn không thể không bị ấn tượng mạnh.

Chúng tôi không bao gồm khả năng OCR của Google Drive trong bài đăng này; một chút cho sự phổ biến của Google, nhưng nhiều hơn nữa vì thực tế là chúng tôi muốn thử nghiệm một vài dịch vụ OCR trực tuyến miễn phí khác hiện có.

Thông qua bạn: Bạn muốn giới thiệu công cụ OCR trực tuyến nào khác cho độc giả của chúng tôi? Và bạn đã thử cái nào mà bạn sẽ không bao giờ sử dụng lại?

Đăng lại Đăng lại tiếng riu ríu E-mail Hướng dẫn cho người mới bắt đầu để tạo hoạt ảnh cho bài phát biểu

Hoạt hình có thể là một thách thức. Nếu bạn đã sẵn sàng bắt đầu thêm đối thoại vào dự án của mình, chúng tôi sẽ chia nhỏ quy trình cho bạn.

cách ghim trên bản đồ google
Đọc tiếp Chủ đề liên quan
  • Internet
  • Năng suất
  • Chuyển đổi tệp
  • OCR
Giới thiệu về tác giả Rob Nightingale(272 bài báo đã xuất bản)

Rob Nightingale có bằng Triết học tại Đại học York, Vương quốc Anh. Anh ấy đã làm việc với tư cách là nhà tư vấn và quản lý truyền thông xã hội trong hơn 5 năm, đồng thời tổ chức các cuộc hội thảo ở một số quốc gia. Trong hai năm qua, Rob cũng là một nhà văn công nghệ và là Giám đốc Truyền thông Xã hội của MakeUseOf và Biên tập viên Bản tin. Bạn thường thấy anh ấy đi du lịch khắp thế giới, học cách chỉnh sửa video và thử nghiệm nhiếp ảnh.

Xem thêm từ Rob Nightingale

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký