Представленные тетрадки содержат в себе скрипты для проведения операций, описанных в работе "Типологическое исследование существительных, обозначающих верхнюю часть объекта, с применением компьютерных методов сбора и анализа материала"
Файл, в который подается таблица универсалий, а на выходе получается таблица с доабвленным переводом от Google и Freedict
Файл, в который подается таблица универсалий, а на выходе получается таблица с доабвленным переводом от ABBY
Файл, в который подается таблица с переводами, а на выходе получается таблица с подсчетом количества употреблений по корпусу
Части all_corpus.ipynb для одновременной работы над несколькими языками
Эта папка содержит в себе три CSV-таблицы, каждая из которых отображает полученные данные для соответсвующего языка.
- Колонки, название которых начинается со слова
context, отображают слова-контексты - Колонки, название которых заканчивается на
_sum, отображают суммы всех употреблений этого обозначения верха с соответсвущюим контекстом
Эта папка так же содержит в себе три CSV-таблицы. Каждая отражает:
- Суммарное количество употреблений для каждого возможного обозначения верха под колонками
_sum - Нормализованное суммарное количество употреблений под колонками
_norm
Файл, полученный после пилотных исследований, с него начинается вся работа. Для понятности некотрых колонок добавлена карта противопоставлений.