Microsoft Edgeブラウザーは、画像の説明を自動的に生成して音声で表示することを学習しました

Microsoftは、視覚障害を持つ人々がWebコンテンツを簡単に操作できるようにするEdgeブラウザーの新機能を発表しました。私たちは、スクリーンリーダーを使用してコンピューターで作業する視覚障害者に役立つ画像記述の自動生成について話しています。

簡単に言うと、Edgeは開いた画像の説明を自動的に生成できるようになり、スクリーンリーダーはこのテキストをユーザーに再生します。画像の説明を解析して生成するプロセスでは、AzureCognitiveServicesクラウドサービスを使用します。ブラウザがタグなしの画像を見つけると、適切なアルゴリズムで処理するためにその画像をMicrosoftサーバーに移動します。ユーザーは、画像の説明を生成するために何の努力もする必要はありません。

この新機能は、JPEG、PNG、GIF、WEBPなどの多くの一般的な形式で機能します。説明は現在、5つの言語でサポートされています。同時に、説明を生成するために使用されるアルゴリズムは、120を超える言語の画像からテキストを認識することができます。 Microsoftは、この段階では説明の生成が完全に機能しない可能性があるため、テキストの品質があまり高くない場合があると警告しています。また、50×50ピクセル未満の画像、巨大な画像、その他のカテゴリのコンテンツについては、説明が作成されません。

報告によると、新機能は最新バージョンのEdgeに搭載されています。有効にするには、[オプション]メニューに移動し、[ユーザー補助]セクションに移動して、[スクリーンリーダー用にMicrosoftから画像の説明を取得する]オプションを有効にします。この機能は、Edge for Windows、Linux、およびmacOSでサポートされています。

2022-03-18 17:45:05

著者: Vitalii Babkin

前 | 次