Яндекс.Диск умеет искать по тексту на картинках
Компания Яндекс сообщила о новой возможности своего облачного хранилища. В Яндекс.Диске появилась возможность искать изображения форматов JPEG, GIF и PNG, содержащие текст поискового запроса. Достаточно ввести в поисковую строку нужное слово, и система найдёт на Диске картинки, на которых оно встретится. В результатах поиска пользователи также увидят файлы и папки, в названиях и описаниях которых есть это слово, и документы, в тексте которых оно содержится.
Когда на Диске тысячи фотографий, разложенных по разным папкам, поиск по текстам позволит быстро найти среди них нужную. Например, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст.
Система состоит из двух частей — классификатора картинок и модуля распознавания. Сначала классификатор, глубокая нейронная сеть, отбирает из всех картинок те, на которых изображён текст. Он учится отличать их от прочих на огромной базе изображений. Затем модуль распознавания разбивает линии текста на отдельные символы. Для каждого символа алгоритм выбирает несколько наиболее вероятных вариантов распознавания среди известных ему.
Конечно, точность распознавания текста (а значит, и успех поиска) зависит от типа изображения, его чёткости, фона, на котором находится текст, и многих других факторов. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями — 63,2%, а для скриншотов приближается к 100%. Помимо русского языка, система также распознаёт английский, украинский и турецкий. Точность распознавания текстов всего потока изображений более 70%.
Поиск по картинкам уже пользуется популярностью, особенно у блогеров, как способ продвижения своих блогов. Часто проще что-то найти по картинке а не по текстовому запросу. Поэтому интересные фото или изображения в блоге могут бесплатно привлечь на сайт или в блог новый трафик. В сочетании с возможностями сервиса персональных рекомендаций Яндекс.Дзен, который особенно хорош для получения целевого трафик, такими хитрыми возможностями прокачать свой блог или сайт точно не стоит пренебрегать. Иногда для таких целей можно схитрить и создать второй канал Яндекс.Дзен. О том как это сделать пишут тут: https://cpamafia.pro/threads/kak-sozdat-vtoroj-kanal-na-jandeks-dzen.5267/. Используйте такие лайфхаки, чтобы обойти конкурентов и привлечь новых посетителей на свой блог или сайт.
Когда на Диске тысячи фотографий, разложенных по разным папкам, поиск по текстам позволит быстро найти среди них нужную. Например, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст.
Система состоит из двух частей — классификатора картинок и модуля распознавания. Сначала классификатор, глубокая нейронная сеть, отбирает из всех картинок те, на которых изображён текст. Он учится отличать их от прочих на огромной базе изображений. Затем модуль распознавания разбивает линии текста на отдельные символы. Для каждого символа алгоритм выбирает несколько наиболее вероятных вариантов распознавания среди известных ему.
Конечно, точность распознавания текста (а значит, и успех поиска) зависит от типа изображения, его чёткости, фона, на котором находится текст, и многих других факторов. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями — 63,2%, а для скриншотов приближается к 100%. Помимо русского языка, система также распознаёт английский, украинский и турецкий. Точность распознавания текстов всего потока изображений более 70%.
Поиск по картинкам уже пользуется популярностью, особенно у блогеров, как способ продвижения своих блогов. Часто проще что-то найти по картинке а не по текстовому запросу. Поэтому интересные фото или изображения в блоге могут бесплатно привлечь на сайт или в блог новый трафик. В сочетании с возможностями сервиса персональных рекомендаций Яндекс.Дзен, который особенно хорош для получения целевого трафик, такими хитрыми возможностями прокачать свой блог или сайт точно не стоит пренебрегать. Иногда для таких целей можно схитрить и создать второй канал Яндекс.Дзен. О том как это сделать пишут тут: https://cpamafia.pro/threads/kak-sozdat-vtoroj-kanal-na-jandeks-dzen.5267/. Используйте такие лайфхаки, чтобы обойти конкурентов и привлечь новых посетителей на свой блог или сайт.