Лемматизатор (Lemmatizer)

Вступление
…Основное и единственное назначение лемматизатора — вернуть для исходного слова его базовую словарную форму. Например, для русских существительных это форма именительного падежа единственного числа, для глаголов — форма инфинитива. (Компьютерная грамматика)

Эта статья специально написана для того, чтобы попытаться ускорить процесс поиска нужного мне лемматизатора с одной стороны, и с другой стороны, поделиться тем, что уже мною достигнуто и найдено по этой теме.

Итак, что я ищу. Мне нужен ивритский лемматизатор. На данный момент мне удалось создать php-скрипт, в котором реализация лемматизатора для иврита построена на использовании программы hspell. Но качество его работы меня не устраивает, поэтому я продолжаю поиск. Но как бы там ни было, я желаю показать исходный код этого скрипта, может быть, кому-то он тоже поможет:

PHP лемматизатор для иврита, русского, английского и немецкого

<?php
//каталог, где установлена программа RML
$RML="/home/michael/RML";
switch ($_GET[langua]) {
  case("Hebrew") :
    $command = 'echo '.(($_GET[ie]!=null) ? iconv($_GET[ie],'CP1251',$_GET[SearchText]) : $_GET[SearchText]).' | hspell -l';
    exec($command, $arr);
    if (count($arr) == 0) {
      $content=$_GET[SearchText];
    } else {
      for ($q=0; $q<count($arr); $q++) {
        if (ereg('щвйаеъ лъйб щроцае:', $arr[$q]) == true) {
          $content="<div>НЕТ ТАКОГО СЛОВА В ИВРИТЕ</div>";
        } else if ($q == 0) {
          $content.="<div>".ereg_replace("^.+:( | .+\+)([^=+]+)(\+*|=[0-9]+)$", "\\2", $arr[$q])."</div>";
        } else if (ereg("^\t(.+)\((.+)\)$",$arr[$q],$regs) == true) {
          if ($regs[1] == "щереъ") {
            if ($regs[2] == "x") {
              for ($i=$q; $i>0; --$i) {
                if (ereg("^.+:( | .+\+)(.+)",$arr[$i],$regs) == true) {
                  $content.="<div>".$regs[2]."</div>";
                  break;
                }
              }
            }
          } else {
            $content.="<div>".$regs[1]."</div>";
          }
        }
      }
    }
    break;
  case("HebMorph") : // Была попытка использовать HebMorph - https://github.com/synhershko/HebMorph/wiki. Не эффективно.
    $file_str = file_get_contents("http://localhost:8080/solr/admin/analysis.jsp?name=contents_he&qval=".$_GET[SearchText]);
    $content=mb_convert_encoding(htmlspecialchars($file_str), 'HTML-ENTITIES', 'UTF-8');
    break;
  case("Russian") :case("English") :case("German") :
    if (! file_exists ($_GET[TemplateFile])) :
      $query = split("-", $_GET[SearchText]);
      for ($i=0; $i<count($query); $i++) {
        $handle = fopen($_GET[TemplateFile], 'w');
        fwrite($handle, $query[$i]);
        fclose($handle);
        $command = 'export RML="'.$RML.'"; $RML/Bin/TestLem '.$_GET[langua].' '.$_GET[TemplateFile];
//Утилита TestLem требует наличие переменной $RML - каталог, где находится RML
//Usage: TestLem (RUSSIAN|ENGLISH|GERMAN) [file]
        $file=$_GET[TemplateFile].'.lem';
        exec($command, $res); //массив $res заполняется строками вывода команды $command
        if (count($res) > 5) {
          if ( is_readable($file) ) {
            $fh = fopen($file, 'r');
            $file = fread($fh, filesize($file));
            fclose($fh);
            unlink($_GET[TemplateFile]);
            $arr[$i] = split("#", ereg_replace("^.*-> ", "",$file));
          } else {
            $content=$file." is not readable!";
          }
        } else {
// При тестировании Лемматизатора, для анализирования непредвиденного случая
          echo '$res[0]="'.$res[0].'", $res[1]="'.$res[1].'", $res[2]="'.$res[2].'", $res[3]="'.$res[3].'", $res[4]="'.$res[4].'"';
        }
      }
      for ($i=0; $i<count($arr[0])-1; $i++) {
        if (count($query)==1) {
          $content.="<div>".ereg_replace(" .*$", "",$arr[0][$i])."</div>";
        } else {
          for ($j=0; $j<count($arr[1])-1; $j++) {
            $content.="<div>".ereg_replace(" .*$", "",$arr[0][$i])."-".ereg_replace(" .*$", "",$arr[1][$j])."</div>";
          }
        }
      }
    else :
      $content="Уважаемый пользователь! Сервис временно недоступен";
    endif;
    break;
}
if ($_GET[oe]!=null) $content=iconv('CP1251',$_GET[oe],$content);
if ($_GET[client]=="app") :
  header('Content-Type: text/xml');
  echo "<body>".$content."</body>";
else :
  echo "Translate_DivElement.innerHTML=\"\";Translate_DivElement.innerHTML+=\"".str_replace(array("\r", "\n", "\"", "\'"), array("", "", "\\\"", "\\\'"), $content)."\";";
endif;
?>

Внимание! Все исходные коды, приводимые в этой статье, необходимо сохранять в формате Windows ANSI с таблицей кодировки cp1251.

Как уже было сказано, реализация лемматизатора для иврита в этом коде построена на использовании программы hspell, для трёх других языков, – русского, английского и немецкого, – на использовании программы RML — известный лемматизатор Алексея Сокирко (проект aot.ru).

Загрузка и сборка из исходников RML
Для установки этой программы сделайте следующее:

1 Запустите Терминал. После запуска Терминала введите команду для загрузки исходников из репозитория RML:
svn co https://seman.svn.sourceforge.net/svnroot/seman/trunk/ RML
2 Перейдите в каталог, куда вы загрузили исходники программы:
cd RML
3 Установите пакет realpath:
sudo apt-get install realpathили пропишите путь к RML (в данный момент это текущий каталог) в переменной окружения RML:
export RML=$PWD
4 Проверьте, установлены ли у вас пакеты flex и bison, если нет — установите.

5 Для сборки программы запустите скрипт build.sh:
sh build.sh
Внимание! В вышеприведённом php-скрипте необходимо указать переменную $RML. Вместо
/home/michael/seman укажите настоящее название каталога, куда вы установили программу RML (в соответствии с вышеприведённой инструкцией — это каталог, куда вы загрузили исходники программы).

Передача данных PHP лемматизатору

Для начала нужно поместить у себя на локальном сервере, обычно это каталог /var/www, файл PHP лемматизатора с php-кодом, приведённым выше. После этого, самый простой способ посмотреть как выполняется лемматизация с помощью данного кода — создать небольшой HTML-файл следующего содержания:

HTML-код: "Тест лемматизатора"

<html>
<head>
<title>Тест лемматизатора</title>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
</head>
<body marginbottom="0" margintop="0" style="margin-top: 0px;" marginheight="0" marginwidth="0">
<center>
<form method="GET" action="http://localhost/lemmatizer.php" name="lemmatizer_form" id="lemmatizer_form" target="Lemmas">
<table style="border: 1px solid black;" width="270">
<tbody><tr>
<td nowrap="nowrap"><b>&nbsp;Язык:</b></td> 
<td align="right">
<select name="langua" style="font-size: 13px;">
        <option value="Russian">Русский</option>
        <option value="English">Английский</option>
        <option value="German">Немецкий</option>
</select>
</td>
</tr>
<tr>
<td><b>&nbsp;Слово:</b></td>
<td align="right"> 
        <input type="text" name="SearchText" size="30" maxlength="64">
</td>
</tr>
<tr>
<td><input type="hidden" name="TemplateFile" value="morph"></input></td>
<td align="right"><input type="submit" value="Найти Лемму"></td>
</tr>
</tbody></table>
</form>
   <IFRAME name="Lemmas"></IFRAME>
</center>
</body></html>

Данный HTML-код предполагает, что исходный код PHP лемматизатора находится в файле lemmatizer.php. Из-за того, что символы, передаваемые PHP лемматизатору, должны быть в кодировке cp1251, запрос в виде
http://localhost/lemmatizer.php?TemplateFile=morph&langua=Russian&SearchText=WordToLemmatization
(где WordToLemmatization — слово-аргумент передаваемое лемматизатору), вводимый в адресной строке веб-браузера, не принесёт ожидаемого результата, поскольку в данном случае символы будут в кодировке utf-8. По этой причине для тестирования и потребовалось создавать такого рода HTML-файл.

При работе данного теста PHP лемматизатор возвращает лемму для слова-аргумента в объект IFRAME с именем Lemmas. При желании обработать полученный результат JavaScript'ом мы наткнёмся на препятствие, вызванное политикой безопасности, – доступ к информации из другого домена для веб-браузера невозможен. Чтобы преодолеть данное препятствие необходимо создать ещё один php-скрипт:

PHP-код: provider.php

<?php 
foreach ($_GET as $key => $value) {
  if($key != url) {$url .= "&" . $key . "=" . $value;}
}
$content = str_replace(array("\r", "\n", "\""), array("", "", "\\\""), file_get_contents($_GET['url'] . $url)); 
echo "Translate_DivElement.innerHTML=\"\";Translate_DivElement.innerHTML+=\"$content\";";
?>

Поместите этот код в файл provider.php у себя на локальном сервере. Теперь запрос в лемматизатор будет выглядеть в следующем виде:
http://localhost/provider.php?url=http://localhost/lemmatizer.php?TemplateFile=morph&langua=Russian&SearchText=WordToLemmatization
Т.е. теперь слово-аргумент передаётся PHP лемматизатору не напрямую, а через этот промежуточный модуль, который возвращает результат в объект SCRIPT как выполняемый код на языке JavaScript.

Чтобы вы могли освоить работу этого механизма, создайте другой HTML-файл, который наглядно демонстрирует эту методику:

HTML-код: "Тест обработки данных"

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
<title>Тест обработки данных, полученных от лемматизатора</title>
<SCRIPT language="javascript">
<!--

function Continue() {
  v = document.all.lang.value;
  switch (v) {
    case 'Russian':
      src="http://localhost/provider.php?url=http://localhost/lemmatizer.php?TemplateFile=morph"+v+"&langua=Russian&SearchText=" + document.all.SearchText.value;
      break;
    case 'English':
      src="http://localhost/provider.php?url=http://localhost/lemmatizer.php?TemplateFile=morph"+v+"&langua=English&SearchText=" + document.all.SearchText.value;
      break;
    case 'German':
      src="http://localhost/provider.php?url=http://localhost/lemmatizer.php?TemplateFile=morph"+v+"&langua=German&SearchText=" + document.all.SearchText.value;
      break;
    case 'Hebrew':
      src="http://localhost/provider.php?url=http://localhost/lemmatizer.php?langua=Hebrew&SearchText=" + Convert(document.all.SearchText.value,1).replace(/'/g,"\\'").replace(/"/g,'\\"');
      break;
  }
  FormSearch();
}

function FormSearch() {
  var Translate_DynScript = document.createElement ("SCRIPT");
  document.body.appendChild(Translate_DynScript);
  Translate_DivElement.innerHTML="";
  Translate_DynScript.src = src;
  Count=0;
  interval_id = window.setInterval("OnTimer()", 10);
}

function OnTimer() {
  if(Translate_DivElement.innerHTML != ""){
    clearInterval(interval_id);
    Lemmas = new Array();
    var j=0;
    for (var i = 0; i < Translate_DivElement.getElementsByTagName("DIV").length-0; i+=1) {
      if (Translate_DivElement.innerHTML.match("НЕТ ТАКОГО СЛОВА В ИВРИТЕ") != null) {
        alert('Слов не найдено. Слово содержит ошибку. Попытайтесь найти и исправить ошибку для данного слова самостоятельно.');
        return;
      }
      if(!LemmasCheck(Translate_DivElement.getElementsByTagName("DIV")[i].innerHTML.toLowerCase())) { 
        Lemmas[j++] = Translate_DivElement.getElementsByTagName("DIV")[i].innerHTML.toLowerCase(); 
      }
    }
    alert(Lemmas);
    return;
  }
  if(Count == 4000){
    clearInterval(interval_id);
    FormSearch();
    return;
  }
  else {
    Count++;
  }
}

function Convert(utftext,Direction) {// конвертирование символов: 1 - из cp1255 в cp1251; 2 - из cp1251 в cp1252
  var string = "";
  var i = 0;
  var c = 0;
  while ( i < utftext.length ) {
    c = utftext.charCodeAt(i);
    if (c < 128) {
      string += String.fromCharCode(c);
    }
    else {
      string += String.fromCharCode(((Direction == 1) ? c-416 : c+416));
    }
    i++;
  }
  return string;
}

function LemmasCheck(newlemma) {
  for (var i = 0; i < Lemmas.length; i++) {
    if(newlemma == Lemmas[i]) return true;
  }
  return false;
}

//-->
</SCRIPT>
</head>
<body marginbottom="0" margintop="0" style="margin-top: 0px;" marginheight="0" marginwidth="0">
<center>
<table style="border: 1px solid black;" width="270"><tbody>
<tr>
<td nowrap="nowrap"><b>&nbsp;Язык:</b></td> 
<td align="right">
<select name="lang" id="lang" style="font-size: 13px;">
        <option value="Russian">Русский</option>
        <option value="English">Английский</option>
        <option value="German">Немецкий</option>
        <option value="Hebrew">Иврит</option>
</select>
</td>
</tr>
<tr>
<td><b>&nbsp;Слово:</b></td>
<td align="right"><input type="text" name="SearchText" size="30" maxlength="64"></td>
</tr>
<tr>
<td>&nbsp;</td>
<td align="right"><input type="button" value="Найти Лемму" onclick="Continue();"></td>
</tr>
</tbody></table>
<div id="Translate_DivElement"></div>
</center>
</body>
</html>

Здесь мы имеем два новых объекта:

Объект SCRIPT, создаваемый в функции FormSearch(). Служит для приёма данных из промежуточного модуля provider.php, которые тут же выполняются как JavaScript-код, в результате чего те данные, которые были получены от PHP лемматизатора, перебрасываются в другой объект с id: Translate_DivElement.
Объект DIV с id: Translate_DivElement. Служит для приёма данных, полученных от PHP лемматизатора.

Теперь данные, поступающие в объект Translate_DivElement, не являются данными, принадлежащими другому домену, и поэтому подлежат дальнейшей обработке. Запрос в лемматизатор происходит в тот момент, когда свойству src объекта Translate_DynScript присваивается значение переменной src, т.е. в строке: Translate_DynScript.src = src;
Функция OnTimer() ожидает, когда же в объекте Translate_DivElement появятся данные от PHP лемматизатора. Как только данные появились, начинается их обработка. При обработке с помощью функции LemmasCheck() происходит проверка — является ли каждая лемма уникальной, т.е. происходит фильтрация с отсевом повторяющихся лемм. Затем через окно alert выводится полученный результат — массив Lemmas, содержащий список лемм без наличия повторов. Таким образом демонстрируется тот факт, что данные, полученные от PHP лемматизатора действительно можно обрабатывать.

В целях упрощения от использования объекта FORM пришлось отказаться. Форма перезагружает страницу, и это не позволяет обработать полученные данные. Чтобы использовать форму, её необходимо поместить в другое окно/фрейм.

Как создать собственный словарь

А не создать ли нам теперь свой собственный HTML-словарь, содержащий функцию лемматизации? Попробуйте! Вот вам в помощь php-код, который позволит выполнять запрос в словарь DICT:

PHP-код: dict.php

<?php
$command = 'dict -d '.$_GET[dbname].' -f -s word $(echo '.$_GET[word].' | iconv -f '.$_GET[cp].' -t utf8)';
exec($command, $translations);
$arr = array();
for ($q=0; $q<count($translations); $q++) {
  if (strpos($translations[$q], 'localhost') === false) {
    if (trim($translations[$q]) != '' && $word != null) {
      $arr[$word][] = trim(mb_convert_encoding($translations[$q], 'HTML-ENTITIES', 'UTF-8'));
    }
  } 
  else if ($translations[$q+1] != null && strpos($translations[$q+1], 'localhost') === false) {
    $word = trim(mb_convert_encoding($translations[++$q], 'HTML-ENTITIES', 'UTF-8'));
    $arr[$word][] = trim(mb_convert_encoding($translations[++$q], 'HTML-ENTITIES', 'UTF-8'));
  }
}
if ($arr) {
  for (reset($arr); $key = key ($arr); next ($arr)):
    print("<div>$key</div><div>".implode('; ', array_unique($arr[$key]))."</div>"); 
  endfor; 
} 
else {
  echo "Слов не найдено";
}
?>

Ссылку для запроса при этом следует указать примерно в таком виде:
src="http://localhost/provider.php?url=http://localhost/dict.php?dbname=databasename&cp=cpxxxx&word=" + lemma; где <databasename> — кодовое имя словаря, "cpxxxx" — кодировка и lemma — слово в словарной форме (лемма). Пример: src="http://localhost/provider.php?url=http://localhost/dict.php?dbname=russian-hebrew-2006-11-08_luna&cp=cp1251&word=" + lemma;

Узнать список имён словарей DICT можно по команде:
dict -DВот, что вылетело мне в ответ на эту команду:
Databases available: fd-eng-rus English-Russian Freedict dictionary temp unknown german_rus2 german_rus2 russian-hebrew-2006-11-08_luna russian-hebrew-2006-11-08_luna Russian-Hebrew_Phrase_book Russian-Hebrew_Phrase_book Hebrew-Russian Hebrew-Russian Russian-Hebrew Russian-Hebrew
Поскольку перед данной статьёй не стоит задача создать профессиональный HTML-словарь, а всего лишь продемонстрировать основные возможности данной методики, то я сейчас не буду пытаться создать такое HTML-приложение, которое автоматически войдет в процесс конфигурирования и само создаст список со всеми доступными словарями. Этот список я создам самостоятельно. Итак, вот, что после недолгих раздумий получилось у меня:

HTML-словарь

<html>
<head>
<title>HTML-словарь с функцией лемматизации</title>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
<style type="text/css">
<!--
body,td,th {
        font-family: Verdana, Arial, Helvetica, sans-serif;
        font-size: 12px;
        color: #253b4a;
}
body {
        margin-left: 0px;
        margin-top: 0px;
        margin-right: 0px;
        margin-bottom: 0px;
}
.style4 {
        color: #253b4a;
        font-size: 12px;
        font-weight: bold;
}
-->
</style>
<SCRIPT language="javascript">
<!--

function Continue() {
  Tr_DivE.innerHTML="";
  v = document.all.lang.value;
  switch (v) {
    case '0':
      src="http://localhost/provider.php?url=http://localhost/lemmatizer.php?TemplateFile=morph"+v+"&langua=English&SearchText=" + document.all.SearchText.value;
      break;
    case '1':case '2':case '3':
      src="http://localhost/provider.php?url=http://localhost/lemmatizer.php?TemplateFile=morph"+v+"&langua=Russian&SearchText=" + document.all.SearchText.value;
      break;
    case '4':
      src="http://localhost/provider.php?url=http://localhost/lemmatizer.php?langua=Hebrew&SearchText=" + Convert(document.all.SearchText.value,1).replace(/'/g,"\\'").replace(/"/g,'\\"');
      break;
  }
  FormSearch(1);
}

function FormSearch(c) {
  var Translate_DynScript = document.createElement ("SCRIPT");
  document.body.appendChild(Translate_DynScript);
  Translate_DivElement.innerHTML="";
  Translate_DynScript.src = src;
  Count=0;
  interval_id = window.setInterval("OnTimer("+c+")", 10);
}

function OnTimer(c) {
  if(Translate_DivElement.innerHTML != ""){
    clearInterval(interval_id);
    switch (c) {
      case 0:
        if (Translate_DivElement.innerHTML.match("Слов не найдено") != null) {
          lemmatizer();
          return;
        }
        Tr_DivE.innerHTML+=Translate_DivElement.innerHTML;
        lemmatizer();
        return;
      case 1:
        Lemmas = new Array();
        var j=0;
        for (var i = 0; i < Translate_DivElement.getElementsByTagName("DIV").length-0; i+=1) {
          if (Translate_DivElement.innerHTML.match("НЕТ ТАКОГО СЛОВА В ИВРИТЕ") != null) {
            alert('Слов не найдено. Слово содержит ошибку. Попытайтесь найти и исправить ошибку для данного слова самостоятельно.');
            return;
          }
          if(!LemmasCheck(Translate_DivElement.getElementsByTagName("DIV")[i].innerHTML.toLowerCase())) { 
            Lemmas[j++] = Translate_DivElement.getElementsByTagName("DIV")[i].innerHTML.toLowerCase(); 
          }
        }
        break;
    }
    LemmaCount=-1;
    lemmatizer();
    return;
  }
  if(Count == 4000){
    clearInterval(interval_id);
    FormSearch(c);
    return;
  }
  else {
    Count++;
  }
}

function Convert(utftext,Direction) {// конвертирование символов: 1 - из cp1255 в cp1251; 2 - из cp1251 в cp1252
  var string = "";
  var i = 0;
  var c = 0;
  while ( i < utftext.length ) {
    c = utftext.charCodeAt(i);
    if (c < 128) {
      string += String.fromCharCode(c);
    }
    else {
      string += String.fromCharCode(((Direction == 1) ? c-416 : c+416));
    }
    i++;
  }
  return string;
}

function lemmatizer() {
  if(++LemmaCount < Lemmas.length) {
    lemma=Lemmas[LemmaCount];
    switch (v) {
      case '0':
        src="http://localhost/provider.php?url=http://localhost/dict.php?dbname=fd-eng-rus&cp=cp1250&word=" + lemma;
        break;
      case '1':
        src="http://localhost/provider.php?url=http://localhost/dict.php?dbname=russian-hebrew-2006-11-08_luna&cp=cp1251&word=" + lemma;
        break;
      case '2':
        src="http://localhost/provider.php?url=http://localhost/dict.php?dbname=Russian-Hebrew_Phrase_book&cp=cp1251&word=" + lemma;
        break;
      case '3':
        src="http://localhost/provider.php?url=http://localhost/dict.php?dbname=Russian-Hebrew&cp=cp1251&word=" + lemma;
        break;
      case '4':
        src="http://localhost/provider.php?url=http://localhost/dict.php?dbname=Hebrew-Russian&cp=cp1255&word=" + lemma;
        break;
    }
    FormSearch(0);
  }
  else {
    if (Tr_DivE.innerHTML == "") {Tr_DivE.innerHTML="Слов не найдено";}
    return;
  }
}

function LemmasCheck(newlemma) {
  for (var i = 0; i < Lemmas.length; i++) {
    if(newlemma == Lemmas[i]) return true;
  }
  return false;
}

//-->
</SCRIPT>
</head>
<body marginbottom="0" margintop="0" style="margin-top: 0px;" marginheight="0" marginwidth="0">
<center>
<table class="style4" style="border: 1px solid black;" width="270"><tbody>
<tr>
<td nowrap="nowrap"><b>&nbsp;Тип перевода:</b></td> 
<td align="right">
<select name="lang" id="lang" style="font-size: 13px;">
        <option value="0" selected="selected">English-Russian Freedict dictionary</option>
        <option value="1">Pусско-Ивритский 2006-11-08_luna</option>
        <option value="2">Pусско-Ивритский Phrase_book</option>
        <option value="3">Pусско-Ивритский</option>
        <option value="4">Иврит-Русский</option>
</select>
</td>
</tr>
<tr>
<td><b>&nbsp;Слово:</b></td>
<td align="right"> 
        <input type="text" name="SearchText" size="30" maxlength="64">
</td>
</tr>
<tr>
<td>&nbsp;</td>
<td align="right"><input value="Перевести &gt;&gt;" style="font-size: 13px;" type="submit" onclick="Continue();"></td>
</tr>
</tbody></table>
<br>
<div id="Tr_DivE" style="visibility: visible; overflow-y: scroll; width:
 270px; height: 140px; border: 1px solid black;">
</div>
<div id="Translate_DivElement" style="visibility: hidden;"></div>
</center>
</body></html>

Можно посмотреть видеоролик, который демонстрирует работу этого HTML-кода, или опробовать Он-Лайн версию этого словаря. См. также мою статью "HTML-словарь с функцией лемматизации".

Комментарии (2)

Гость - 7 Март, 2011 - 16:32

Почему ты не сказал что надо bison установить и flex?

ответить

Michael72 - 7 Март, 2011 - 21:15

Большое спасибо за комментарий. Сам я собрал RML давно, поэтому в журнале Терминала уже нет возможности посмотреть, какие действия мне пришлось делать при сборке. А инструкцию readme перевести с английского не умею. В ближайшее время подправлю статью с учётом этого замечания. Все ваши замечания и плюсики весьма дороги для меня, поскольку представляют собой источник вдохновения.

Отправить комментарий

Формат ввода

Доступны HTML теги: <h1> <h2> <h3> <h4> <h5> <h6> <a> <img> <em> <u> <hr> <strong> <b> <s> <cite> <q> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd> <br> <p> <table> <tr> <td>
Строки и параграфы переносятся автоматически.
Используйте <code>...</code> для вставки кода в сообщения
Используйте [collapse] и [/collapse] для сворачиваемого текстового блока. [collapse collapsed] или [collapsed] для изначально свернутого блока.
Для вставки видео используйте [video:URL]

Подробнее о форматировании

Код: *

Введите цифры

Leave this field blank:

Лемматизатор (Lemmatizer)

Комментарии (2)

Отправить комментарий

Вход в систему

Сейчас на сайте