В прошлом посте помощью кодов управляющих символов, поиска и замены мы убирали пробелы, интервалы и «серые пробелы» в редакторе Ms Office. Сегодня попробуем перенести эти навыки на Open Office и Libre Office. Вариант действий для Ms Office отличается только кодом символов и это будет оговорено отдельно. Цель поста — рассказать новичкам о способностях редакторов по форматированию текста с помощью регулярных выражений. Опытные офисные работники знают и не такое. 

Сейчас мы узнаем как найти и заменить текст в Ms Office Word, Open Office Writer, Libre Office в сложном варианте, с выделением подстроки произвольной длины и содержащей произвольный текст.

Итак, попробуем отформатировать некий текст.

регулярные выражения Office 1

Сначала определим задачу. Допустим из огромного массива строк нам нужно выделить адреса сайтов. Что мы имеем? Строки разной длины, с доменами с префиксом www и без него, с https и без.

Данный пример можно реализовать через электронные таблицы и более простым методом, используя более сложный алгоритм, но начнём с простого. Оценим обстановку. 

регулярные выражения Office 2

Нам повезло и перед каждым адресом уже есть символ табуляции. Это замечательно. С помощью этого символа мы сформируем таблицу.

регулярные выражения Office 3

В данном случае мы используем табуляцию как разделитель столбцов, но это может быть и другой символ как мы увидим дальше.

регулярные выражения Office 4

Получилось замечательно. Исходный текст, как видно, мог бы быть легко отформатирован в электронной таблице, что было бы несколько быстрее. 

То, что нам нужно, а именно адреса сайтов, находятся во втором столбце. Удаляем лишние столбцы.

регулярные выражения Office 5

В строках помимо адреса сайта есть ещё дополнение в виде указания страницы сайта. Будем убирать лишнее в каждой строчке.

регулярные выражения Office 6

Убираем лишний текс оставляя только название сайта.  Нажимаем Ctrl+F (поиск и замена)

Для Open Office (Libre Office) открываем пункт «Детали»  и отмечаем галочкой «Регулярные выражения». Меняем / на конструкцию вида \t . Что такое \t? Это представление знака табуляции.  Там, где в тексте будет /, он заменится на табуляцию.

регулярные выражения Office 7

Для Ms Office в пункт «Заменить на» ставим ^9. 

форматировать текст 2 lassimarket.ru

преобразовываем наш текст в табличку.

регулярные выражения Office 8

Теперь можем удалить лишние данные.

регулярные выражения Office 9

Убираем в тексте через поиск и замену  www. и https:// В Open Office (Libre Office) в пункте «Заменить на» просто ничего не ставим.

регулярные выражения Office 10

Вот, что у нас получилось из разрозненного списка с кучей лишней информации.

регулярные выражения Office 11

Ещё скажу, что есть специальные сервисы, программы и макросы для форматирования текста, но данный способ выручит вас на любом компьютере.


В следующем посте обязательно расскажу об автоматизации действий по обработке информации с помощью макросов и напишем несколько строчек кода для полного удобства при форматировании текста. 

Ниже, под спойлером, Список регулярных выражений Open Office (Libre Office) и Ms Office

Скрытый текст

Сохраните на память, делитесь с друзьями и оставляйте комментарии.


https://i0.wp.com/lassimarket.ru/wp-content/uploads/2016/02/регулярные-выражения-Office-7.png?fit=1001%2C586https://i0.wp.com/lassimarket.ru/wp-content/uploads/2016/02/регулярные-выражения-Office-7.png?resize=150%2C150Антон ТретьякИнтернетВ прошлом посте помощью кодов управляющих символов, поиска и замены мы убирали пробелы, интервалы и 'серые пробелы' в редакторе Ms Office. Сегодня попробуем перенести эти навыки на Open Office и Libre Office. Вариант действий для Ms Office отличается только кодом символов и это будет оговорено отдельно. Цель поста - рассказать новичкам о...Полезные советы по Андроиду, программам, приложениям, лайфхаки и сервисы Интернета для повседневной жизни