Tính năng AI mới của Chrome giải quyết một trong những vấn đề muôn thuở của web

Để giúp người dùng mù và mắt kém, Google đang sử dụng máy học để tạo mô tả cho hàng triệu hình ảnh.
Internet Internet và phương tiện truyền thông xã hội nói riêng là bị chi phối bởi hình ảnh. Nhưng không phải ai cũng có thể nhìn thấy chúng.

Để trải nghiệm internet theo cách mà hầu hết mọi người thường làm, người dùng mù và mắt kém thường dựa vào trình đọc màn hình hoặc màn hình chữ nổi. Nhưng các thiết bị này phụ thuộc vào người tạo trang web ghi nhớ để tạo ra những gì được gọi là văn bản thay thế, văn bản hoặc văn bản thay thế, một thẻ cung cấp mô tả về những gì trong hình ảnh.

Tuy nhiên, trong khi nhiều trang web lớn bao gồm văn bản thay thế (và nhiều hơn nữa sẽ phải đưa ra, do Tòa án Tối cao đã giữ nguyên phán quyết rằng Đạo luật Người khuyết tật Mỹ áp dụng cho các không gian trực tuyến cũng như các trang web vật lý ), những trang nhỏ hơn thường không. Và văn bản thay thế không phải lúc nào cũng xuất hiện trên phương tiện truyền thông xã hội, nơi hình ảnh và meme bay nhanh hơn một số hệ thống có thể theo kịp.

Trợ giúp đang được cung cấp bởi nhóm trợ năng Chrome tại Google. Hôm nay, công ty đang công bố một tính năng mới của Chrome, tận dụng khả năng nhận dạng hình ảnh đáng kể của Google để tạo ra các mô tả văn bản thay thế bằng hình ảnh.

Hiện tại, trạng thái không may là vẫn còn hàng triệu triệu hình ảnh chưa được gắn nhãn trên web, ông Laura Allen, một người quản lý chương trình cao cấp trong nhóm trợ năng của Chrome, người có tầm nhìn thấp. Khi bạn điều hướng bằng trình đọc màn hình hoặc màn hình chữ nổi, khi bạn đến một trong những hình ảnh đó, về cơ bản bạn sẽ chỉ nghe thấy "hình ảnh" hoặc "đồ họa không nhãn", hoặc chuỗi yêu thích của tôi, một chuỗi số siêu dài đó là tên tập tin, hoàn toàn không liên quan.

Sử dụng cùng một công nghệ cho phép bạn tìm kiếm hình ảnh của bể bơi trên Google Photos, giờ đây Chrome có thể tự động tạo mô tả về những gì hình ảnh mô tả. Chẳng hạn, một trình đọc màn hình có thể bắt gặp hình ảnh của chuối, dừa và dứa được bày trên bàn và nói với người dùng: xuất hiện là trái cây và rau quả ở chợ. Một hình ảnh khác về một con chó nằm xuống với một quả bóng tennis giữa hai bàn chân của nó có thể được dịch thành: Xuất hiện là con chó bắt được một cái gì đó. Công cụ này cũng có thể đọc các từ trong hình ảnh, như phiếu đóng gói hoặc dấu hiệu. Trong trường hợp đó, bộ mô tả sẽ bắt đầu bằng chữ xuất hiện để nói.

Một bức ảnh của dứa, chuối và dừa
[Ảnh: lịch sự của Google]
Chúng tôi luôn thêm ngữ cảnh hóa Nhóm truy cập hệ điều hành tại Google.
Một con chó với hai quả bóng tennis
[Ảnh: lịch sự của Google]
Các bản dịch không hoàn hảo, mặc dù nhóm Chrome đã quyết định tránh lỗi không chính xác. Nếu thuật toán không tự tin hình ảnh là gì, nó sẽ không cố gắn nhãn cho nó.
Hiện tại, công cụ này đã dán nhãn hơn 10 triệu hình ảnh trong một vài tháng thử nghiệm. Nó đang dần được triển khai cho người dùng và Chrome đang quảng cáo cụ thể cho những người sử dụng trình đọc màn hình để khuyến khích họ dùng thử. Những người dùng đó cũng có quyền kiểm soát số tiền họ muốn sử dụng: Họ có thể quyết định bật nó cho một trang web hoặc họ có thể quyết định để nó luôn bật. Nó chỉ có sẵn cho các trang web bằng tiếng Anh, nhưng sẽ sớm đến với nhiều ngôn ngữ hơn.

Những mô tả này cũng sẽ không được chia sẻ với quản trị viên hoặc nhà phát triển web, vì Mazzoni nói rằng bất kỳ người nào nhìn vào hình ảnh đều có thể tạo ra một mô tả tốt hơn. Nhưng nó là một công cụ hữu ích cho hàng triệu triệu bức ảnh chưa được dán nhãn (bao gồm cả những tiết lộ đầy đủ về vụn trên những trang này trên trang web này).

Rất nhiều hình ảnh trên web không phải đến từ các nhà phát triển mà từ các blogger hoặc chỉ từ các bài đăng trên phương tiện truyền thông xã hội, theo ông Mazzoni. Và đó là một trong những lĩnh vực chính mà tôi nghĩ nó siêu hữu ích.

Tính năng ghi nhãn của Chrome là một ví dụ về cách máy học có thể làm cho web trở thành một nơi dễ truy cập hơn nhiều. Mặc dù điều quan trọng hơn là những người đang xây dựng trang web cam kết làm cho chúng có thể truy cập được cho mọi người, thuật toán có thể chọn các trang rơi vào vết nứt.

Nhận xét

Bài đăng phổ biến từ blog này

Máy tính xách tay iPad huyền thoại: Trái cấm của Apple

WeWork có thể tồn tại?

Trình điều khiển giao hàng Instacart cho biết các mẹo đang giảm một cách bí ẩn