[
новости
/
+++
|
форум
|
wiki
|
теги
|
]
TextCat - implementation of the text categorization algorithm
Дата
15 Sep 2004
[
исправить
]
Заголовок
TextCat - implementation of the text categorization algorithm
Пояснение
Реализация алгоритма "N-Gram-Based Text Categorization" (на Perl) статистического анализа текста для автоматического определения языка на котором написан текст (для русского языка производится также определение кодировки).
Статья отражающая суть алгоритма
(на русском языке).
Home URL
http://odur.let.rug.nl/~vannoord/TextCat/
Флаг
russian
Раздел
Полезные Perl модули.
Преобразование из одной кодировки в другую
Ключи
rus
,
codepage
,
language
, (
найти похожие документы
)
Добавить ссылку
Поиск ссылки (
regex
):
Последние заметки
-
20.11
Решение проблемы со шрифтами в Steam после выставления времени после 2038 года
-
18.11
Раскладка клавиатуры для ввода символов APL
-
10.09
Настройка СУБД Postgresql для аутентификации пользователей через Active Directory
-
09.09
Настройка СУБД PostgreSQL 13 под управлением Pacemaker/Corosync в Debian 11
-
08.09
Создание виртуальных машин с помощью Qemu KVM
-
25.07
Создание программ под SynapseOS
-
24.07
Случайная задержка в shell-скрипте, выполняемом из crontab (без башизмов)
-
03.07
Выборочное туннелирование сайтов через WireGuard
-
19.05
Настройка шрифтов для консоли и терминала
-
26.02
Тестирование хелловорлда под 17 платформ одним скриптом
RSS
|
Следующие 15 записей >>
Спонсоры:
Хостинг:
Закладки на сайте
Проследить за страницей
Created 1996-2023 by
Maxim Chirkov
Добавить
,
Поддержать
,
Вебмастеру