Нерасшифрованные до сих пор знаки, оставленные поздней Индской цивилизацией, больше похожи на запись древнего разговорного языка иероглифами, чем на набор отдельных пиктограмм. Их статистические характеристики в гораздо большей степени напоминают таковые современных и древних языков, и в гораздо меньшей степени – статистику нелингвистических последовательностей или символики формальных языков.
Учёные из США и Индии под руководством Раджеша Рао из Университета американского штата Вашингтон вычислили условную энтропию последовательностей символов разной длины в «текстах», взятых из разных источников. В них был и современный английский язык – рассматриваемый и как набор слов, и как набор отдельных букв, произведения шумерской и древней тамильской письменности, языки программирования, и даже последовательности нуклеотидов в ДНК человека и белков, кодируемых ДНК бактерии.
Эта «мера случайности» последовательностей велика для совсем случайных наборов символов и мала для жёстко заданных последовательностей. Например, для длинных последовательностей она будет меньше для английского, выраженного отдельными буквами, чем для английского, выраженного отдельными словами: порядок букв в слове чётко задан, а порядок слов в предложении зависит от его смысла. Для коротких последовательностей отношение будет обратным.
Наборы индских символов оказались гораздо ближе к естественным живым и мёртвым языкам, чем к языку программирования (использовался FORTRAN) и тем более – нелингвистическим последовательностям. Более того, он гораздо более напоминает языки, выраженные словами, а не буквами, так что и символы – скорее иероглифы, означающие слова, чем знаки, означающие отдельные буквы. Короткое сообщение Рао и его коллег принято к публикации в Science. Хотя результат и не является прямым доказательством осмысленности этих текстов, он должен обнадёживать в попытках расшифровать эти послания.
«Надписи», оставленные Индской цивилизацией на рубеже 3-го и 2-го тысячелетий до н.э., были открыты в конце XIX века и долгое время считались подобием египетских иероглифов. Однако несколько лет назад появилось масштабное исследование, один из выводов которого состоял в том, что эти «надписи» не представляют собой никакого связного текста, а являются, скорее всего, пиктограммами, обозначающими какие-то конкретные предметы – например, перечислением каких-то предметов или богов.
Авторы той скептической работы даже пообещали награду в $10 тысяч всякому, кто обнаружит индский «текст» длиннее 50 символов. Рао и его соавторы на награду претендовать не смогут, но делают более вероятным, что скептикам когда-нибудь придётся расстаться с означенной суммой.