-->

WE ARE CEE

CENTER ELECTRICAL ENGINEERING

FPGA, Embedded System, PCB Layout, Robotics and More

Khoa học & Công nghệ

Phương Pháp Và Thuật Toán Nhận Dạng Ký Tự Quang Học Trong Mạng Nơ-ron Nhân Tạo

1. Các Bước Xây Dựng Nên Bài Toán

Dưới đây là các bước chính khi tiến hành thiết kế và thực thi mạng noron nhân tạo cho bài toán nhận dạng ký tự :

Xác định dữ liệu đầu vào, và đầu ra mong muốn để tiến hành huấn luyện cho mạng noron.

- Đầu vào : Vì tiểu luận chỉ tập trung vào nghiên cứu và cài đặt quá trình nhận dạng ký tự neural, nên các dữ liệu đầu vào phải qua xử lý và đạt chuẩn yêu cầu trước khi đưa vào nhận dạng.Các yêu cầu dữ liệu đầu vào là các file ảnh dạng văn bản có định dạng *.bmp, đây là dạng file ảnh chuẩn, có kiểu màu pixel đen và trắng, để việc tiến hành nhận dạng được chính xác.Các file ảnh này đã qua giai đoạn tiền xử lý : xử lý ảnh nhiễu, ảnh đa sắc , lọc ảnh...

- Đầu ra mong muốn : là một file text chứa các ký tự Unicode tương ứng mà chương trình mong muốn huấn luyện mạng học thuộc.Số ký tự đầu ra mong muốn phải tương ứng với số kí tự ảnh đầu vào cần huấn luyện.

Hình 1: Một ví dụ về mẫu các ký tự trong nhận dạng ký tự quang học

2. Xác Định Cấu Trúc Mạng

- Mạng noron được xây dựng theo phương pháp học có giám sát.

Bài toán lựa chọn mạng Feed-forward 3 lớp với cấu trúc như sau :

- Số noron lớp đầu vào : 150 noron.

Giải thích : Việc huấn luyện cho mạng học là một vòng lặp duyệt qua lần lượt các ký tự ảnh giúp mạng noron nhớ và nhận dạng các ký tự ảnh này.Với mỗi vòng lặp, một ký tự sẽ được đưa vào giảng dạy cho mạng noron học.Trong quá trình này, mỗi ký tự sẽ được phân tích và chuyển tỉ lệ vào một ma trận nhị phân 15 x 10 .Ứng với mỗi điểm lưới của ma trận sẽ được tuyến tính hóa tạo ra tương ứng với một noron đầu vào.Vì vậy ma trận sẽ tạo ra 15x10=150 noron đầu vào.

Lưu ý : Việc chọn số lượng noron đầu vào hay nói cách khác việc chọn tỉ lệ ma trận đầu vào cho kí tự là rất quan trọng.

Nếu số lượng noron lớn quá sẽ dẫn đến việc :

1. Nhận dạng những kí tự có font chữ nhỏ hoặc trung bình bị sai hoặc không chính xác.

2. Chương trình viết ra phải duyệt qua rất nhiều vòng lặp dẫn đến chương trình bị chậm, hoặc gây ra tình trạng bị đứng máy khi chạy.

Nếu số lượng noron quá nhỏ :

- Việc phân tích các kí tự ảnh thông thường và lớn sẽ dẫn đến sai số lớn , vì vậy, việc nhận dạng kí tự cũng sẽ thiếu tính chính xác.

- Qua kiểm nghiệm, và dựa trên nhiều tài liệu, nhận thấy giá trị 150 noron đầu vào là khá phù hợp để nhận dạng với kiểu kí tự ảnh có font chữ trung bình, và phổ biến.Các kí tự ảnh này có chiều cao trung bình là 70 pixel và chiều rộng khoảng 54 pixel.

- Số noron lớp ẩn : 500 noron.Việc lựa chọn giá trị này dựa trên thực nghiệm của các tài liệu chuyên về nhận dạng kí tự quang học.Số noron này được quyết định từ những kết quả tối ưu và giá trị lỗi cơ sở trong quá trình huấn luyện.

- Số noron đầu ra : 16 noron tương ứng với 16 bit nhị phân của mã Unicode.Từ 16 noron này ta tổng hợp và chuyển thành 16 bit nhị phân, sau cùng chuyển thành 1 kí tự Unicode.

 

BÀI VIẾT LIÊN QUAN:

Seminar: Giới thiệu dây chuyền làm mạch in PCB

Chiều ngày 1/12/2017 Trung tâm CEE đã tổ chức Seminar: Giới thiệu dây chuyền ...

Robot giúp các cặp đôi hôn nhau từ xa

Các nhà khoa học đang chế tạo phần đầu robot có thể cảm nhận và truyền áp lực ...

Phát triển pin Lithium-không khí mới với hiệu suất gấp 5 lần so với hiện tại

Một nguyên mẫu pin lithium-air (liti-không khí) hoàn toàn mới với mức năng ...

12 công cụ giúp bạn thoải mái làm việc từ bất cứ đâu trên thế giới

Chỉ cần mạng Internet tốt và các công cụ làm việc ổn, bạn hoàn toàn có thể dễ ...