⌨️TelegramКак Экспортировать

Экспорт чата

Настольная версия телеграма позволяет экспортировать историю чата. Этот документ рассказывает, как это сделать и что с этим делать.

Как экспортировать

  1. В настольной версии зайти в чат

  2. Нажать на три точки сверху справа

  3. Выбрать пункт Export chat history (в русской версии — Экспорт истории чата.

  4. Там можно выбрать, что именно экспортировать и сколько. Текстовые сообщения будут экспортированы в любом случае.

  5. Запустить, подождать. Если экспортировать только текст, то будет довольно бысто.

  6. В указанном месте появится папка с экспортированными данными. *.html-файлы можно открывать в браузере и читать чат.

Что с этим можно делать?

Что угодно, уж. Например, можно скормить базу сообщений OPT и рассчитать хорошую раскладку.

Также можно построить чатботов, которые повторяют наше поведение.

Как получить только текст сообщений?

В *.html много всякого есть, не только текст сообщений. Чтобы достать его, можно воспользоваться скриптом ../extractor.pl. Для его запуска требуется установленный Perl на компьютере. На дистрибутивах GNU+Linux он обычно предустановлен. Примеры ниже предполагают Unix окружение, на Windows будет по-другому. TODO: инструкция для Windows.

Достать текст из файла и напечатать результат:

perl extractor.pl имя_файла_сюда

Достать текст из файла и сохранить результат в другой файл:

perl extractor.pl имя_файла_сюда > имя_другого_файла_сюда

Посчитать 15 самых частых слов (цифру 15 в конце можно менять, если убрать часть
head -n 15 то напечатает вообще все слова):

perl extractor.pl имя_файла_сюда | tr '[:space:]' '[\n*]' | grep -v "^\s*$" | sort | uniq -c | sort -bnr | head -n 15