The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

/ Для программиста / Машинное обучение, AI
·25.01.2023 Обновление голосовых данных Mozilla Common Voice 12.0 (20 +8)
  Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи...
·29.12.2022 Выпуск библиотеки компьютерного зрения OpenCV 4.7 (24 +18)
  Состоялся релиз свободной библиотеки OpenCV 4.7 (Open Source Computer Vision Library), предоставляющей средства для обработки и анализа содержимого изображений. OpenCV предоставляет более 2500 алгоритмов, как классических, так и отражающих последние достижения в области компьютерного зрения и систем машинного обучения. Код библиотеки написан на языке С++ и распространяется под лицензией Apache 2.0. Биндинги подготовлены для различных языков программирования, включая Python, MATLAB и Java...
·29.12.2022 Исследование влияния AI-ассистентов, подобных GitHub Copilot, на безопасность кода (118 +20)
  Группа исследователей из Стэнфордского университета изучила влияние использования интеллектуальных помощников при написании кода на появление в коде уязвимостей. Рассматривались решения на базе платформы машинного обучения OpenAI Codex, такие как GitHub Copilot, позволяющие формировать достаточно сложные блоки кода, вплоть до готовых функций. Опасения связаны с тем, что так как для тренировки модели машинного обучения использован реальный код из публичных репозиториев GitHub, в том числе содержащий уязвимости, синтезированный код может повторять ошибки и предлагать код, в котором присутствуют уязвимости, а также не учитывать необходимость выполнения дополнительных проверок при обработке внешних данных...
·26.12.2022 Google опубликовал библиотеку Magritte для скрытия лиц на видео и фотографиях (39 +15)
  Компания Google представила библиотеку magritte, предназначенную для автоматического скрытия лиц на фотографиях и видео, например, для обеспечения требований по сохранению конфиденциальности людей, случайно попавших в кадр. Скрытие лиц имеет смысл при формировании коллекций изображений и видео, передаваемых для анализа сторонним исследователям или размещаемым публично (например, при публикации панорам и фотографий в Google Maps или при обмене данными для тренировки систем машинного обучения). Библиотека использует методы машинного обучения для выявления объектов в кадре и оформлена как надстройка над фреймворком MediaPipe, который использует TensorFlow. Код написан на языке С++ и распространяется под лицензией Apache 2.0...
·16.12.2022 Система машинного обучения Stable Diffusion адаптирована для синтеза музыки (56 +17)
  Проектом Riffusion развивается вариант системы машинного обучения Stable Diffusion, адаптированный для генерации музыки вместо изображений. Музыка может синтезироваться на основе предложенного шаблона или текстового описания на естественном языке. Компоненты для синтеза музыки написаны на языке Python с использованием фреймворка PyTorch и доступны под лицензией MIT. Обвязка с интерфейсом реализована на языке TypeScript и также распространяется под лицензией MIT. Натренированные модели открыты под пермиссивной лицензией Creative ML OpenRAIL-M, допускающей использование в коммерческих целях...
·13.12.2022 Выпуск системы машинного перевода OpenNMT-tf 2.30 (46 +9)
  Опубликован выпуск системы машинного перевода OpenNMT-tf 2.30.0 (Open Neural Machine Translation), использующей методы машинного обучения. Код развиваемых проектом OpenNMT-tf модулей написан на языке Python, использует библиотеку TensorFlow и распространяется под лицензией MIT...
·12.12.2022 Обновление Sevimon, программы видеоконтроля напряжения мышц лица (22 +3)
  Вышла версия 0.1 программы Sevimon, предназначенной для помощи в контроле напряжения мышц лица через видеокамеру. Программа может быть использована для устранения перенапряжения, косвенного воздействия на настроение и, при длительном применении, предотвращения появления мимических морщин. Для определения позиции лица на видео задействована библиотека CenterFace. Код sevimon написан на Python и распространяется под лицензией AGPLv3...
·24.11.2022 Представлена система синтеза изображений Stable Diffusion 2.0 (142 +22)
  Компания Stability AI опубликовала вторую редакцию системы машинного обучения Stable Diffusion, способной синтезировать и изменять изображения на основе предложенного шаблона или текстового описания на естественном языке. Код инструментов для обучения нейронной сети и генерации изображений написан на языке Python с использованием фреймворка PyTorch и опубликован под лицензией MIT. Уже обученные модели открыты под пермиссивной лицензией Creative ML OpenRAIL-M, допускающей использование в коммерческих целях...
·12.11.2022 Обновление открытого аудиокодека Lyra 1.3 (42 +15)
  Компания Google опубликовала выпуск аудиокодека Lyra 1.3, нацеленного достижение высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации. Качество речи на битрейтах 3.2 kbps, 6 kbps и 9.2 kbps при использовании кодека Lyra примерно соответствует битрейтам 10 kbps, 13 kbps и 14 kbps при использовании кодека Opus. Для решения поставленной задачи помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Эталонная реализация кода написана на C++ и распространяется под лицензией Apache 2.0...
·06.11.2022 Судебное разбирательство против Microsoft и OpenAI, связанное с генератором кода GitHub Copilot (164 +53)
  Мэтью Баттерик (Matthew Butterick), разрабатывающий открытые проекты для типографики, и юридическая компания Joseph Saveri Law Firm, инициировали судебное разбирательство (PDF) против производителей технологий, используемых в сервисе GitHub Copilot. Среди ответчиков Microsoft, GitHub и компании, курирующие проект OpenAI, подготовивший модель генерации кода OpenAI Codex, которая лежит в основе GitHub Copilot. В ходе разбирательства предпринята попытка привлечь суд к определению степени законности создания сервисов, подобных GitHub Copilot, и выяснению, нарушают ли такие сервисы права других разработчиков...
·03.11.2022 Использование машинного обучения для определения эмоций и контроля над своей мимикой (50 –5)
  Андрей Савченко из нижегородского филиала Высшей школы экономики опубликовал результат своих исследований в области машинного обучения, связанных с распознаванием эмоций на лицах людей, присутствующих на фотографиях и видео. Код написан на языке Python с использованием PyTorch и распространяется под лицензией Apache 2.0. Доступно несколько готовых моделей, в том числе пригодных для использования на мобильных устройствах...
·02.11.2022 Facebook опубликовал звуковой кодек EnCodec, использующий машинное обучение (60 +3)
  Компания Meta/Facebook (запрещена в РФ) представила новый звуковой кодек EnCodec, использующий методы машинного обучения для повышения степени сжатия без потери качества. Кодек может применять как для потоковой передачи звука в режиме реального времени, так и для кодирования для последующего сохранения в файлах. Эталонная реализация EnCodec написана на языке Python с использованием фреймворка PyTorch и распространяется под лицензией CC BY-NC 4.0 (Creative Commons Attribution-NonCommercial), допускающей использование только в некоммерческих целях...
·25.10.2022 Bumble открыл систему машинного обучения для выявления непристойных изображений (104 +1)
  Компания Bumble, развивающая один из крупнейших online-сервисов знакомств, открыла исходные тексты системы машинного обучения Private Detector, применяемой для определения непристойных изображений на загружаемых в сервис фотографиях. Система написана на языке Python, использует фреймворк Tensorflow и распространяется под лицензией Apache-2.0. Для классификации используется свёрточная нейронная сеть EfficientNet v2. Для загрузки доступна готовая модель для выявления изображений обнажённых людей. Точность определения составляет более...
·13.10.2022 Открыт код системы машинного обучения для генерации реалистичных движений человека (48 +9)
  Группа исследователей из Тель-Авивского университета открыла исходные тексты, связанные с системой машинного обучения MDM (Motion Diffusion Model), позволяющей генерировать реалистичные движения человека. Код написан на языке Python с использованием фреймворка...
·01.10.2022 Google опубликовал открытый аудиокодек Lyra V2 (87 +21)
  Компания Google представила аудиокодек Lyra V2, использующий методы машинного обучения для достижения максимального качества передачи речи при использовании очень медленных каналов связи. Новая версия отличается переходом на новую архитектуру нейронной сети, поддержкой дополнительных платформ, расширенными возможностями управления битрейтом, повышением производительности и достижением более высокого качества звука. Эталонная реализация кода написана на C++ и распространяется под лицензией Apache 2.0...
Следующая страница (раньше) >>



Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру