Словарь языка Чехова

Этот словарь охватывает все художественные произведения А.П.Чехова: рассказы, повести и драмы. Словарь представлен в виде двух упакованных файлов: storyChekh.zip и wordsChekh.zip.
storyChekh.zip содержит текстовые файлы произведений Чехова
wordsChekh.zip содержит сам словарь.
Для использования словаря необходимо скачать и распаковать оба файла в подходящий каталог.
Каждый файл из архива storyChekh.zip имеет имя с указанием года написания произведения, идентификационный номер расказа и сокращенное название произведения, напр. 1881_40_В_ВАГОНЕ.txt
Формат текста такого файла следующий:
N предложения, Само предложение. Знаки пунктуации, дефисы и пр. опущены, напр.:
5 предложение из рассказа N 40
5 На небе на земле и в вагонах тьма
Каждый файл из архива wordsChekh.zip имеет имя с указание года, напр.: 1881.txt
Формат текста такого файла следующий:
N рассказа, N предложения, N слова в предложении, само слово (словоформа), напр.
40 5 4 земле
Поля разделены знаками табуляции.
Словарь разбит по годам для удобства пользования.
Вы можете загрузить эти файлы словаря в различные базы данных, MS Access, MySQL, MS FoxPro, а также в электронную таблицу MS Excell, либо пользоваться ими в текстовом редакторе.
Для получения меток части речи и списка лемм словаря напишите письмо по адресу
potemkin@philol.msu.ru

Chekhov’s language dictionary

This dictionary covers all the artistic works by Anton Chekhov: stories, novels and drama. Vocabulary contain two compressed files:
storyChekh.zip
and
wordsChekh.zip
storyChekh.zip contains text files of Chekhov's works
wordsChekh.zip contains the dictionary itself.
You need to download and unzip both files into the appropriate directory.
Each file from the archive storyChekh.zip has a name indicating the year of the story origin, identification number of the story and abbreviated title of the story, for example.
1881_40_В_ВАГОНЕ.txt
Text format of the file is as follows:
Sentence N. The sentence itself. Punctuation marks, hyphens, etc. are omitted, eg .:
Sentence #5 from the story #40
5 На небе на земле и в вагонах тьма
Each file from the archive wordsChekh.zip has a name with the year, eg .: 1881.txt
Text format of the file is as follows:
Story #, Sentence #, Word #, the word itself, eg .:
40 5 4 земле
Fields are separated by tab characters.
Dictionary is split by years for your convenience.
You can download these files to various databases, MS Access, MySQL, MS FoxPro, as well as to MS Excell, or use them in a text editor.
For the part of speech tags and lemmas vocabulary list send a request to
potemkin@philol.msu.ru