Доклад С.С. Сая "Именные причинные конструкции в славянских языках: сопоставительный анализ систем по данным параллельного корпуса"

2020-09-22

22 сентября в 12:00 на платформе Zoom состоится доклад С.С. Сая (Институт лингвистических исследований РАН) на тему "Именные причинные конструкции в славянских языках: сопоставительный анализ систем по данным параллельного корпуса". Ссылка на видеоконференцию будет дана позже.

Аннотация доклада:

По именными причинными конструкциями понимаются такие конструкции, в которых событие-причина синтаксически представлено в виде именной группы (старик вскрикнул от боли; он не пришел из-за недостатка времени). В славянских языках именные причины обычно маркируются при помощи предлогов и/или падежей. Цели доклада состоят в том, чтобы на эмпирических корпусных данных а) определить круг маркеров, используемых для кодирования именных причин в славянских языках, б) установить набор семантических признаков, регулирующих выбор между этими маркерами в отдельных языках, и в) при помощи квантитативных методов выявить сходства и различия между славянскими языками в изучаемой области и по возможности интерпретировать их в ареально-типологическом и историческом аспекте.

В качестве источника данных для исследования использовались данные параллельного корпуса PARASOL (http://www.parasolcorpus.org). К анализу привлекались данные 11 славянских языков (русский, белорусский, украинский, польский, чешский, словацкий, словенский, хорватский, сербский, македонский, болгарский), для которых была создана база, включающая 231 параллельный контекст. Анализ опирался на построение матриц расстояния, позволяющих измерить как а) семантические сходства и различия между отдельными контекстами, так и б) сходства и различия между системами, обнаруживаемыми в отдельных славянских языках. Для интерпретации результатов использовались как стандартные методы (многомерное шкалирование, иерархическая кластеризация и т.д.), так и менее оригинальный метод, опирающийся на энтропию и взаимную информацию (Mutual Information).

Среди прочего в докладе будут обсуждаться следующие выводы.

а) В славянских языках систематически проводится различие между непосредственными (закричать от боли, задержаться из любопытства) и опосредованными (опоздать из-за брата, добиться благодаря новому методу) причинами. Единственный язык, в котором наблюдается тенденция к стиранию границы между двумя зонами, — словенский.

б) Непосредственные причины выражаются в значительной мере грамматикализованными средствами — падежными маркерами или первообразными предлогами, соответствующими простым пространственным схемам. Репертуар соответствующих единиц в славянских языках относительно стабилен.

в) Опосредованные причины по преимуществу выражаются специализированными вторичными предлогами или пространственными предлогами, соответствующими сложным пространственным схемам. Эти показатели кросс-лингвистически нестабильны.

г) Самый общий вывод состоит в том, что показатели, используемые в отдельных языках для кодирования именных причин, менее стабильны, чем сами те признаки, которые обусловливают выбор между конструкциями. В частности, чешский язык резко выделяется на фоне других языков благодаря частотному использованию творительного падежа для кодирования непосредственных причин, однако по характеру распределения между конкурирующими конструкциями оказывается очень близок словацкому и в целом не выделяется на общеславянском фоне.