Программное обеспечение для обработки естественного языка
Нижеследующий набор инструментов обработки естественного языка является популярным сборником ПО для обработки естественного языка ( (англ.) NLP) [1]. ПО включает набор библиотек, фреймворков и пакетов для символического и статистического анализа естественного языка и обработки речи. Инструменты NLP обычно выполняют обнаружение предложений, токенизацию, определение частей речи, речевых оборотов, классификацию, кластеризацию, лемматизацию, анализ и разрешение кореферентности и т. п.
| Пакет / библиотека / фреймворк | Язык программирования | Лицензия | Разработчик | Сайт |
|---|---|---|---|---|
| AlchemyAPI | C, C++, C#, Java, Python, Perl, Ruby | Freeware или Коммерческая | Orchestr8 | [1] |
| Fonemica | C#, C++, Java, Python | Коммерческая | Fonemica LLC | https://fonemica.ai/ |
| Digital Sonata | Коммерческая | Digital Sonata Pty Ltd | [2] | |
| Distinguo | C++ | Коммерческая | Ultralingua Inc. | [3] |
| Ellogon | C / C++ | LGPL | Georgios Petasis | [4] |
| FreeLing | C++ | GNU | Universitat Politècnica de Catalunya | [5] Архивировано 6 января 2013 года. |
| General Architecture for Text Engineering | Java | LGPL | GATE research | [6] |
| LingPipe | Java | royalty free или Коммерческая | Alias-i | [7] |
| LinguaStream | Java | Free for research | University of Caen, Франция | [8] |
| MII nlp toolkit | Java | LGPL | UCLA Medical Imaging Informatics (MII) Group | [9] |
| Modular Audio Recognition Framework | Java | BSD | The MARF Research and Development Group, Concordia University | [10] |
| MontyLingua | Python, Java | MIT | [11] | |
| Natural Language Toolkit | Python | GNU | [12] | |
| NooJ (основан на INTEX) | .NET Framework | Free for research | University of Franche-Comté, Франция | [13] |
| OpenNLP | Java | Apache | Online community | [14] |
| Stanford NLP | Java | GNU | The Stanford Natural Language Processing Group | [15] |
| UIMA | Java / C++ | Apache | Apache | [16] |
| Spacy | Python | MIT | Explosion AI, др. | [17] |
См. также
Примечания
- ↑ Курируемая подборка по автоматической обработке текста (англ.). Дата обращения: 7 мая 2020. Архивировано 18 мая 2020 года.