Skip to content

toskn/LexTyp-automatization

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

WaCKy_automatisation

Представленные тетрадки содержат в себе скрипты для проведения операций, описанных в работе "Типологическое исследование существительных, обозначающих верхнюю часть объекта, с применением компьютерных методов сбора и анализа материала"


df_translations_script.ipynb

Файл, в который подается таблица универсалий, а на выходе получается таблица с доабвленным переводом от Google и Freedict

abby_script.ipynb

Файл, в который подается таблица универсалий, а на выходе получается таблица с доабвленным переводом от ABBY

all_corpus.ipynb

Файл, в который подается таблица с переводами, а на выходе получается таблица с подсчетом количества употреблений по корпусу

french_corpus.ipynb, italian_corpus.ipynb

Части all_corpus.ipynb для одновременной работы над несколькими языками


Папка df_corpora_big

Эта папка содержит в себе три CSV-таблицы, каждая из которых отображает полученные данные для соответсвующего языка.

  • Колонки, название которых начинается со слова context, отображают слова-контексты
  • Колонки, название которых заканчивается на _sum, отображают суммы всех употреблений этого обозначения верха с соответсвущюим контекстом

Папка df_sum_norm

Эта папка так же содержит в себе три CSV-таблицы. Каждая отражает:

  • Суммарное количество употреблений для каждого возможного обозначения верха под колонками _sum
  • Нормализованное суммарное количество употреблений под колонками _norm

33_entries.pdf

Файл, полученный после пилотных исследований, с него начинается вся работа. Для понятности некотрых колонок добавлена карта противопоставлений.

About

A repository for code made to optimise the process of research in the field of lexical typology

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors