The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

В Firefox тестируют возможность распознавания текста на изображениях

19.08.2022 20:03

В ночных сборках Firefox началось тестирование функции оптического распознавания текста, позволяющей извлекать текст из размещённых на web-странице изображений, и помещать распознанный текст в буфер обмена или озвучивать для людей с ослабленным зрением при помощи синтезатора речи. Распознавание выполняется при выборе пункта "Copy Text from Image" в контекстном меню, показываемом при клике правой кнопкой мыши на изображении.

Возможность пока включена только на платформе macOS и также скоро станет доступна в сборках для Windows. Реализация завязана на системные OCR API: VNRecognizeTextRequestRevision2 для macOS и Windows.Media.OCR для Windows. О планах по реализации возможности для Linux пока нет данных.

  1. Главная ссылка к новости (https://www.ghacks.net/2022/08...)
  2. OpenNews: Обновление Firefox 103.0.1. Тестирование QuickActions в ночных сборках Firefox
  3. OpenNews: Релиз Firefox 103
  4. OpenNews: В Firefox добавлены простейшие возможности редактирования PDF
  5. OpenNews: В Firefox включена по умолчанию поддержка аппаратного ускорения видео для Linux-систем с Mesa
  6. OpenNews: Разработчики Ubuntu приступили к решению проблем с медленным запуском snap-пакета Firefox
Лицензия: CC-BY
Тип: К сведению
Короткая ссылка: https://opennet.ru/57654-firefox
Ключевые слова: firefox, ocr
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (67) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 20:07, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Всё копируют у chromium'а...
     
     
  • 2.2, dullish (ok), 20:14, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +11 +/
    У яндекс браузера, же!
     
     
  • 3.25, Аноним (25), 22:26, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Разве яндекс не только на .com распознавает?
     
  • 3.54, Аноним (54), 16:24, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    ЯБ слижком общителен. Полчаса и сносишь с выражениямию😊
     
  • 2.27, Аноним (-), 22:49, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +11 +/
    > В ночных сборках Firefox началось тестирования функции оптического распознавания текста

    А что там тестировать? Tesseract есть и давно работает. Или они свой велосипед клепают?

     
     
  • 3.34, Cucumber (?), 05:24, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • –17 +/
    Тессеракт способен распознать только черный текст на белом фоне, и только когда шрифт из набора стандрартных. Что совсем не подходит для рандомных картинок в интернете. И это я пробовал только латиницу.
     
     
  • 4.39, Аноним (-), 08:37, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Любую картинку можно до чернобелой преобразовать. И вообще, насколько часто это все надо чтобы вон то в браузер пихать? Может, туда еще чатик, почтарь, социалочку, калькулятор и платежную ситсему запхать? У китайцев если всего этого нет - вообще не программа. Хотя, погодите, Mozilla Suite что-то такое и делал...
     
  • 4.65, Варфоломей (?), 19:01, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +5 +/
    У вас криокамера протекла. Еще полгода назад скармливал Tesseract совершенно рандомные цветные картинки с самым разным текстом и шрифтами (русскими), включая неоднородные тексты, разных стилей, размерой, с кучей всяких левых знаков и т.п. Finereader и рядом не валялся.
     
  • 4.73, Аноним (73), 13:52, 23/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    4.1.1 нормально распознаёт текст с разноцветных картинок. Хотя к разбиению на абзацы есть претензии.
     
  • 3.38, Бывалый смузихлёб (?), 08:04, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну судя по тексту никакого тесеракта там нет - используются возможности ОСи.
    Поэтому для ябблоси и винды включено а для линуксов и бздей - нет
     
  • 2.49, Аноним (49), 12:46, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    какая разница кто у кого чего копирует, главное чтобы эффективно работало
     

  • 1.3, Аноним (-), 20:24, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А картинки будут задавать по ссылке как свойство background в css, чтобы не копировали, что в итоге и так потребует расширения
     
     
  • 2.10, Аноним (10), 21:01, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Здесь говорится об OCR - распознает любой текст , который отобразит браузер .
     
     
  • 3.23, Аноним (23), 21:43, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Распознавание выполняется при выборе пункта "Copy Text from Image" в контекстном меню, показываемом при клике правок кнопкой мыши на изображении.
     
     
  • 4.31, Аноним (31), 02:49, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    - обновляем встроенную скриншотилкой кнопкой "распознать текст"
    - объясням юзеру про это
    - ...
    - профит!
     
     
  • 5.32, Аноним (23), 04:00, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +2 +/
    у тебя согласованность падежей хромает...
     
  • 5.47, Бывалый смузихлёб (?), 12:01, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    слишком сложно( тем более, что потребуется ещё какую-то область выбирать )
    ведь гораздо проще просто определить элемент по которому кликнули и попытаться распознать картину которая в нём есть

    а то, что элемент может быть прозрачным и изображение может содержаться в позади стоящем элементе - так кого беспокоят такие мелочи

     
  • 2.63, Kuromi (ok), 17:58, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > А картинки будут задавать по ссылке как свойство background в css, чтобы
    > не копировали, что в итоге и так потребует расширения

    Это не спасает от мотивированного пользователя. Все равно картинку можно выцепить через Pаge Info, если нет то есть Инспектор и наконец монитор сетевой монитор в девтулзах для самых упертых.
    Как вариант загрузка картинки в Canvas сильно мешает доступу к ней, но и это не абсолют.

     

  • 1.4, X86 (ok), 20:31, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +10 +/
    Им бы скорость работы браузера допиливать, а не всякую побочку.
     
     
  • 2.8, Аноним (8), 20:58, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    А какие претензии к скорости? Загрузи тяжёлую страницу в огнелисе и хроме, сравни, а потом говори про скорость.
     
     
  • 3.24, penetrator (?), 22:20, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +6 +/
    Chrome немного быстрее, но все равно юзаю лису само собой.
     
     
  • 4.26, Аноним (25), 22:29, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Она восточногерманская? )
     
     
  • 5.48, Бывалый смузихлёб (?), 12:03, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +3 +/
    сложная шутка. Кэп, на помощ!
     
  • 3.58, Аноним (-), 17:30, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Вот кстати да, файрфокс побыстрее открывает тяжелые страницы в последнее время.
     
  • 3.66, X86 (ok), 19:07, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Все браузеры на основе chromium работают в разы быстрее. Надоели эти затупы при начале загрузки страниц. Только в Firefox так.
     
     
  • 4.67, Аноним (-), 23:10, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    У тебя наверно пентиум 2 до сих пор?
     
     
  • 5.71, X86 (ok), 12:17, 23/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > У тебя наверно пентиум 2 до сих пор?

    У меня i7 12700f и память DDR5, а до этого был Ryzen 5 5600x

     

  • 1.5, Аноним (5), 20:31, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +11 +/
    Капчу будет распознавать на морально устаревших сайтах.
     
     
  • 2.6, Аноним (6), 20:39, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Это бан!
     
     
  • 3.53, КО (?), 15:04, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Лол, ну тут я сильно проиграл.
     
  • 2.61, Аноним (-), 17:35, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    На опеннете чтоль? Да неплохо бы, одной кнопкой, и чтобы камент засылал автоматом.
     

  • 1.7, user90 (?), 20:51, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • –7 +/
    Угу, попробовал я последнюю версию Фокса.. наглухо вешает систему нопремер, что не помогают никакие сочетания клавиш)) Нах-нах это "счастье".
     
     
  • 2.12, Аноним (8), 21:03, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +6 +/
    Пробовал я последнюю версию хромого, так он вообще выжигает дорожки на текстолите материнской платы!
     
     
  • 3.14, user90 (?), 21:07, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Нах-нах НОВЫЕ версии, сижу на v91 и всем доволен ;)
     
     
  • 4.20, Аноним (20), 21:30, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    https://www.opennet.ru/opennews/art.shtml?num=57644
     

  • 1.9, Anonim (??), 21:00, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    У них что, с функционалом интерфейса и темами оформления уже всё хорошо чтобы заниматься никому не нужной фигнёй?
     
     
  • 2.11, Аноним (11), 21:02, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > никому не нужной фигнёй

    Говорите за себя.
    Уж в любом случае нужнее, чем пляски с темами.

     
     
  • 3.17, Аноним (10), 21:11, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Так сейчас , что бы сделать с интерфейсом всё что угодно - нужны знания , а раньше поставил расширение - уже крутой . А что только выглядел крутым , а не был им - не важно . Главное показуха !
     
     
  • 4.59, Аноним (-), 17:33, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Мне главное, чтобы кнопка "домик" была на месте. ;)
     
  • 3.40, Аноним (-), 08:41, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    По-моему один хрен. Настраиваемость интерфейса угробили, дополнения стали бесполезными и клонируют хром, нормальную изоляцию браузера от системы в линухе ниасилили в отличие от хрома. И зачем оно такое надо, спрашивается? Как хром - только хуже. Да еще лажаются в каждой третьей версии. То UI сломают, то что-нибудь отваливается, то глюки новые. Они свою рыночную долю продолбали хрому вполне заслуженно. Кому этот кусок пародии на хром надо с дополнительным гемором?
     
     
  • 4.50, Аноним (11), 13:15, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Модно подумать, настраиваемость и дополнения его бы спасли.
     
  • 4.60, Аноним (-), 17:34, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    И вообще, надо ли настраивать интерфейс, если по умолчанию все нормально?
     
  • 2.30, Songo (ok), 01:53, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Ява скрипты обрабатываются мгновенно, рендеринг страниц такой, что гугл завидует, ресурсов совсем не жрёт. Теперь можно и новые функции пилить :))
     

  • 1.13, Kuromi (ok), 21:06, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    "Реализация завязана на системные OCR API: VNRecognizeTextRequestRevision2 для macOS и Windows.Media.OCR для Windows. О планах по реализации возможности для Linux пока нет данных."

    Эх, зачем сразу так обламывать? Штука так-то хорошая, иногда релаьно возникает необходимость по быстрому скопировать текст с картинки. Можно ли это реализовать под Линуксом? Наверное, какие-то же движки OCR есть, другой вопрос что 1) возня с интеграцией 2) качество распознования.
    Предвижу что реализация фичи под Линукс ляжет в долгий ящик.

     
     
  • 2.16, kusb (?), 21:09, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Нефига, в Windows есть OCR API. Мне казалось это скорее отдельная программа. Интересно, какие ещё бриллианты там есть.
     
     
  • 3.18, Аноним (10), 21:13, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Точнее - есть в Windows 10+ . И только там будет работать .
     
  • 2.28, ИмяХ (?), 23:11, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    В линуксе тебе надо -  ты и делай сам.
     
  • 2.29, Аноним (29), 23:27, 19/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Распознавать можно всего тремя способами:

    1) таскать распознавалку с собой

    2) использовать то, что даёт ОС

    3) отсылать изображение стороннему сервису


    Первое - потребует колоссальной работы, обучения нейросеток, да ещё и поднимется вой "а почему в моём браузере это, я не не пользуюсь и не хочу"

    Второе - в линуксах отсутствует

    Третье - уже реализовано в виде дополнений

    Других вариантов нет.

     
     
  • 3.35, Аноним (23), 06:40, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > то, что даёт ОС

    kernel.exe ничего не даёт. А либы по ocr и в лине есть внезапно для тебя.

     
  • 3.62, Kuromi (ok), 17:53, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > 3) отсылать изображение стороннему сервису
    > Третье - уже реализовано в виде дополнений

    Ты забыл добавить, что отсылать стороннему сервису = отсылась картинки с текстом неясной степени конфедициальности непонятно кому.

    Мы ведь не знаем, ЧТО там за текст. Может быть это мемасик с гы-гы подписью, а могут быть какие-то контактные данные. Иногда картиночками показывают пароли или кодовые слова или еще что-то такое, именно для того чтобы НЕ копипастили.

    Казалось бы "ну ты думай что и кому шлешь", но проблема "плагинов" что подсев на удобство можно забыть о осторожности.

    Реализация "в МакОси" вроде как обрабатывает все локально...вроде как (в 21-ом веке ни в чем касательно приватности нельзя быть уверенным).

     
  • 3.74, Аноним (73), 13:56, 23/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Полно дополнений, которые включают реализацию libtesseract на js. Добавить libtesseract в браузер опциональной зависимостью — чисто организационная проблема.
     
  • 2.36, Аноним (36), 07:24, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    В линуксе OCR через Tesseract в консоли делают, не думаю что его будут прикручивать к браузеру
     
     
  • 3.57, Аноним (23), 17:05, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > не думаю что его будут прикручивать к браузеру

    И что мешает прикрутить libtesseract к браузеру?

     
     
  • 4.70, nebularia (ok), 08:03, 22/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    То, что это не API, а конкретная реализация, в отличие от того, что в новости.
     
  • 3.69, Аноним (69), 15:35, 21/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Вешаешь в xfce4-keyboard-settings на любимый шорткат шелл-скрипт, в котором:
    1) Копируешь регион экрана в картинку: xfce4-screenshooter -r
    2) Передаешь картинку в распознавалку: tesseract
    3) Передаешь распознанный текст в системное уведомление (или куда удобно): notify-send
    Работает с любым приложением, и не нужно ждать ебилдов.
     
  • 2.43, 231 (?), 09:08, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Crow Translate - распознает и переводит текст, под линукс и виндовс. Нужные языки OCR нужно добавить в настройках.
     

  • 1.21, Аноним (21), 21:33, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    капчу распознает?
     
  • 1.22, Аноним (22), 21:35, 19/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    А диски оно писать уже может?
     
     
  • 2.41, Аноним (-), 08:43, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Да, еще пусть последний директикс юзерам винды ставит. Какой же браузер без директикса. Можно еще дотнет приволочь. Не то чтобы он лисе нужен, но для солидности - самое то. Что за программа если весит меньше чем 1 сидюк?!
     

  • 1.33, Аноним (-), 05:06, 20/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    >Возможность пока включена только на платформе macOS

    Действительно, зачем поддерживать хоть что-то, кроме смузи-огрызочной платформы, на которой сидят все "разработчики" Мозиллы? 🍎

     
  • 1.45, Аноним (45), 10:01, 20/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    > Windows.Media.OCR

    он локально распознаёт или через серверы microsoft?

     
     
  • 2.56, Аноним (23), 17:00, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > Windows.Media.OCR

    OCR ... runs entirely on the device without requiring an Internet connection.

     

  • 1.46, Аноним (46), 10:20, 20/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В macOS это дефолтная штука - и это истец как удобно
     
  • 1.52, Аноним (52), 14:51, 20/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Всего за каких-то несколько лет ФФ стал таким, что по функционалу тот же яндекс браузер теперь никогда не догонит.
     
     
  • 2.55, Аноним (23), 16:52, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Естественно, что время, потраченное в мозиле на игры с растаманами, обратно не вернуть.
     
  • 2.64, Kuromi (ok), 17:59, 20/08/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > Всего за каких-то несколько лет ФФ стал таким, что по функционалу тот
    > же яндекс браузер теперь никогда не догонит.

    Ну все таки одно дело пилить кастомизированный клон Хрома и другое - свой браузер.

     

  • 1.72, username (??), 12:33, 23/08/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    как же хочется pwa..  да, есть на github от стороннего разработчика, но хочется штатную функцию
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Спонсоры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2022 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру