Cách trích xuất Văn Bản từ bất kỳ Hình Ảnh nào bằng Command Line

Ngày đăng: 04/05/2019   -    Cập nhật: 04/05/2019
Tự đọc một đoạn văn bản từ trên hình ảnh tương đối là dễ. Nhưng tự động trích xuất văn bản từ một hình ảnh sẽ khó khăn hơn một chút.

Và tin tốt là: imgclip cung cấp một giải pháp khá đơn giản.


Trích xuất Văn Bản từ Hình Ảnh bằng Command Line

Trích xuất Văn Bản từ Hình Ảnh bằng Command Line

Chương trình này này chạy tốt trong Mac, Windows và Linux. Nó chỉ đơn giản là lấy văn bản bên trong hình ảnh với ngôn ngữ phù hợp, sau đó trả về đoạn văn bản được sao chép vào bảng tạm của máy tính.

Bạn có thể cài đặt toàn bộ thư viện thông qua npm và nó cài đặt khá đơn giản. Thư viện này chỉ lớn vài KB và nó đi kèm với một tệp JS mà bạn có thể xem trên GitHub.

Imgclip sử dụng thư viện Tesseract.js để tự động xử lý hình ảnh và kéo văn bản qua OCR. Nó là một trong những thư viện OCR mạnh nhất và nó là nguồn mở hoàn toàn giống như imgclip.

Mình ấn tượng nhất với chất lượng và tốc độ của công cụ trích xuất văn bản từ hình ảnh này. Nó thực sự hoạt động để trích xuất văn bản chính xác và nó là một trong những công cụ dễ dàng sử dụng nhất.


Các lệnh trích xuất hình ảnh trong IMGCLIP


Lệnh imgclip phải được chạy trực tiếp trong Command line (Terminal trên Linux), theo sau là đường dẫn tương đối đến hình ảnh. Bạn cũng có thể thêm bốn tùy chọn vào cuối để tùy chỉnh output.

-h, --help: Thông tin output
-v, --version: Phiên bản output
-l, --lang: Ngôn ngữ Output
-p, --print: In ra văn bản trong hình ảnh thay vì chép vào bộ nhớ tạm

Tại thời điểm này Tesseract hỗ trợ 65 ngôn ngữ (Trong đó có cả ngôn ngữ Tiếng Việt). Bạn muốn xuất ra ngôn ngữ nào thì phải --lang phải theo qui định của Tesseract.

Ví dụ: -l eng sẽ tìm kiếm hình ảnh cho văn bản tiếng Anh, trong khi -l jpn sẽ tìm kiếm văn bản tiếng Nhật và thậm chí bạn có thể chạy -l jpn_vert để tìm kiếm văn bản tiếng Nhật theo chiều dọc.

Nếu muốn trích xuất tiếng việt thì sao? chỉ cần sử dụng lệnh: -l vie

Vì imgclip phụ thuộc rất nhiều vào Tesseract, do đó, về cơ bản bạn có sức mạnh của toàn bộ thư viện 
Tesseract

Để bắt đầu, hãy truy cập vào GitHub tải xuống một bản sao hoặc cài đặt imgclip vào một thư mục cụ thể thông qua npm.

Sau đó, bạn có thể chạy imgclip trong command line như một ứng dụng để phân tích bất kỳ hình ảnh nào bạn muốn.

Để xem chính xác imgclip hoạt động như thế nào, hãy xem video ngắn dưới đây:

 

Thật đơn giản và mạnh mẽ phải không nào?

>>> Xem thêm: Thuật toán quick sort tự viết trong PHP NHANH hay CHẬM?




Bình luận Facebook
Mục lục
Đăng ký tư vấn
Nhân viên gọi điện tư vấn miễn phí sau khi đăng ký
Được cập nhật các ưu đãi sớm nhất
Hotline: 0383180086
Tên không được để trống
Số điện thoại không được để trống
Email không được để trống
Hãy đăng ký để nhận những thông tin mới nhất về học bổng mới nhất tại NIIT - ICT Hà Nội
top
Đóng lại Đăng ký học tại NIIT - ICT Hà Nội
6260+ học viên đã theo học tại NIIT - ICT Hà Nội và có việc làm tốt trong ngành lập trình. Nắm lấy cơ hội ngay hôm nay!
Chọn khóa học
  • KHÓA HỌC LẬP TRÌNH FRONT END VỚI REACT.JS
  • KHÓA HỌC LẬP TRÌNH PHP WEB
  • Khóa học PHP Full stack [2023] cho người mới bắt đầu
  • Khóa học BIG DATA với Hadoop và Spark
  • Khóa học Lập trình Android tại Hà Nội
  • [Tuyển sinh 2023] Lập trình viên Quốc tế DigiNxt
  • Khóa học Tiền lương & Phúc lợi (C&B Excel) tại Hà Nội
  • LẬP TRÌNH GAME
    • Khóa học Lập trình Game Unity
  • LẬP TRÌNH WEB FRONT END
    • KHÓA HỌC PYTHON HƯỚNG ĐỐI TƯỢNG
    • KHÓA HỌC ANGULAR & TYPESCRIPT (FRONT END)
  • LẬP TRÌNH WEB BACK END
    • LẬP TRÌNH JAVA WEB VỚI FRAME WORK
    • Lập trình Web với Django
    • Lập trình PHP với Laravel Framework
  • CHƯƠNG TRÌNH ĐÀO TẠO ỨNG DỤNG CÔNG NGHỆ
    • Khóa học Tiền lương & Phúc lợi (C&B Excel) tại TP HCM
  • LẬP TRÌNH WEB FULL STACK
    • Khóa học Java Full stack (IJFD)
  • LẬP TRÌNH MOBILE
    • FRONT-END VỚI REACTJS VÀ REACT NATIVE
    • Lập trình Android Nâng cao
  • ĐÀO TẠO CHO DOANH NGHIỆP
    • KHÓA HỌC BUSINESS ANALYSIC TỪ CƠ BẢN ĐẾN NÂNG CAO 2023
    • Khóa học Magento: Làm chủ CMS TMĐT lớn nhất
    • Khóa học IOT: Xây dựng Sản phẩm IOT với Raspberry Pi
    • Khóa học Automation Testing Chuyên nghiệp
  • KHÓA HỌC DỰ ÁN
    • Học sử dụng bộ Office: Word, Excel, Power Point, Mail chuyên nghiệp
  • KHÓA HỌC KHÁC
    • VBA Excel Toàn Tập (Cơ Bản - Nâng Cao)
    • VBA Excel Nâng cao
    • Khóa học JMeter: Performance Testing
    • Khóa học Tester đạt chuẩn Quốc tế ISTQB Foundation Level
    • Khoá Học Tester đạt chuẩn quốc tế ISTQB Advanced Level
Bạn chưa chọn khóa học cần đăng ký
Tên không được để trống
Số điện thoại không được để trống
Email không được để trống
Đăng ký học thành công!
Cảm ơn bạn đã đăng ký học tại NIIT - ICT HÀ NỘI!