LENTA.RU: МОБИЛЬНАЯ ВЕРСИЯ
PDA.Lenta.ru: Интернет: 2008/10/31 17:21:19

Поисковик Google научился различать слова на изображениях

Компания Google разработала систему оптического распознавания текста. Она позволяет поисковику различать текст на отсканированных изображениях. Об этом сообщается в официальном блоге Google.

В настоящее время Google способен распознать текст на изображениях, сохраненных в формате PDF. О планах Google по расширению возможностей системы не сообщается.

Поисковик уже начал индексировать PDF-файлы. Наибольшую сложность представляет поиск по старым отсканированным документам, где бумага, например, испачкана следами от чашки с кофе, либо имеются различные пометки, сделанные от руки.

Ранее Google запустил в экспериментальном режиме сервис Google Audio Indexing, распознающий звуковую дорожку в видеоклипах. Он конвертирует звук в текст и индексирует последний.

Кроме того, в начале сентября Google сообщил о планах по размещению в интернете отсканированных страниц старых газет и журналов. Они будут помещены в новостной архив поисковика и появятся в результатах поисковой выдачи.

ССЫЛКИ ПО ТЕМЕ

  • A picture of a thousand words? - Блог Google, 30.10.2008
  • Google начал индексацию звукозаписей - Lenta.ru, 17.09.2008
  • Google выложит старые газеты в интернет - Lenta.ru, 09.09.2008

    САЙТЫ ПО ТЕМЕ

  • Google
    http://pda.lenta.ru /news/2008/10/31/search/

    RO.RU
    Мобильные развлечения

    waplog