Команда Grammarly Kyiv ініціює створення першого відкритого анотованого GEC-корпусу української мови та запрошує усіх охочих долучитися до проєкту!
- Що таке GEC-корпус?
Це колекція текстів, що їх написали звичайні люди: есеї, дописи в блогах та соцмережах, відгуки, листи тощо. Ці тексти міститимуть граматичні, стилістичні та орфографічні помилки — бо хто з нас не помиляється? Лінгвісти перевірять ці тексти і виправлять (проанотують) помилки. Команда Grammarly мріє зібрати такий GEC-корпус (GEC - grammatical error correction), щоб викласти його у відкритий доступ для загального користування!
- Що це дасть українській мові?
Прискорить розвиток нових онлайн-систем для виправлення граматики.
- Що це дасть науковій спільноті?
Більше відкритих інструментів для дослідження української мови з точки зору NLP (natural language processing — опрацювання природної мови).
- Як долучитися до проєкту?
Все дуже легко — потрібно перейти на сторінку проєкту та поділитися своїм готовим текстом українською мовою (наприклад, есе, переклад або пост із соціальних мереж). Або ж можна написати новий текст за простою інструкцією на сайті. Кількість текстів, які ви можете додавати, — необмежена.
Збір текстів триватиме до 13 вересня. Стежте за новинами проєкту і першими дізнавайтеся про публікацію корпусу на сторінці Grammarly Kyiv у Facebook!
Долучайтеся та розповідайте друзям і колегам! Створімо перший анотований GEC-корпус української мови разом!