Обрезание строк с помощью функций PHP

В этой статье мы рассмотрим несколько различных способов в PHP обрезать строку на определенное количество слов и символов. Большая часть функций, описанных в этой статье, используется, чтобы продемонстрировать возможности PHP для работы со строками.

Во всех наших примерах мы будем использовать следующую строку, и будем исходить из того, что нам нужно уменьшить количество символов в строке со 187 до 120 символов (для Twitter).

Lorem ipsum velit inceptos posuere augue amet sagittis augue sapien gravida vestra nulla non hac ac luctus imperdiet pulvinar ligula hac elit molestie vestibulum fusce porttitor lacinia.

В нашем примере мы также используем вторую строку из 55 символов, чтобы вы могли проверить возвращаемый результат на более короткой строке.

mb_strimwidth()

mb_strimwidth() возвращает в PHP обрезанную строку по длине и добавляет конечные символы, указанные в функции. Так как это одна из основных функций PHP, ее мы рассмотрим в первую очередь. Применяется она очень просто:

/* 
	mb_strimwidth() 
	http://php.net/manual/en/function.mb-strimwidth.php
	http://www.internoetics.com/2016/02/01/shorten-strings-whole-word-character-count-php/
*/

echo mb_strimwidth($string, 0, 120, '...');

Функция рассматривает свободное пространство как символ. Но это значит, что между последним усеченным символом и конечным символом многоточием будет размещаться пробел. Вы можете обрезать строку без конечного символа, а затем добавить его отдельно. Посмотрите на следующий пример:

rtrim(mb_strimwidth($string, 0, 117)) . '...';

Приведенный выше код добавляет многоточие не зависимо от того, была ли PHP обрезана строка до символа или нет. Чтобы исправить это, мы будем рассчитывать длину строки, и только после этого добавлять многоточие, если исходная строка действительно должна обрезаться. Например:

function internoetics_mb_strimwidth($string, $start = 0, $width = 120, $trimmarker = '...') {
  $len = strlen(trim($string));
  $newstring = ( ($len > 120) && ($len != 0) ) ? rtrim(mb_strimwidth($string, $start, $width - strlen($trimmarker))) . $trimmarker : $string;
 return $newstring;
}

/* Использование */
echo internoetics_mb_strimwidth($string, 0, 120, $trimmarker = '...');

При отправке сообщений в Twitter и на другие ресурсы, где символы чувствительны к регистру, каждый символ имеет значение... и эта функция в ряде случаев сэкономит вам один пробел!

mb_substr()

Функция PHP mb_substr() "получает часть строки". Она возвращает подстроку на основе количества символов. Позиция обрезки отсчитывается от начала строки. Позиция первого символа равна 0. Позиция второго символа равна 1. И так далее.

/* 
	mb_substr() 
	http://php.net/manual/en/function.mb-substr.php
*/

echo mb_substr($string, 0, 120);

Чтобы добавить многоточие (или любой другой конечный символ), мы можем изменить первую функцию, которую рассматривали. Мы обрезаем строку перед добавлением $trimmarker, чтобы гарантировать, что у нас не будет добавляться в PHP обрезанной строке с конца лишний пробел.

function internoetics_mb_substr($string, $start = 0, $length = 120, $trimmarker = '...') {
  $len = strlen(trim($string));
  $newstring = ( ($len > $length) && ($len != 0) ) ? rtrim(mb_substr($string, $start, $length - strlen($trimmarker))) . $trimmarker : $string;
 return $newstring;
}

/* Применение */
echo internoetics_mb_substr($string, 0, 120);

mb_substr(), substr() и mb_strcut()

mb_substr(), substr() и mb_strcut() - еще несколько функций, похожих на те, которые я описал выше. Они отличаются только тем, как обрабатываются многобайтовые наборы символов (китайский язык и т.д.).

Если вы выводите PHP обрезанную часть строки до ближайшего слова на основе количества символов (но без конечного многоточия), используйте следующий код:

echo substr($string, 0, strrpos(substr( $string, 0, 35), ' '));
Изменив функцию, чтобы теперь в конце добавлялись многоточие, мы получим следующее:
/* 
	Усеченный до ближайшего слова текст, основываясь на количестве символов - substr() 
	http://php.net/manual/en/function.substr.php
*/

function internoetics_string_strrpos($string, $length = 137, $trimmarker = '...') {
  $len = strlen(trim($string));                             
  $newstring = ($len > $length) ? rtrim(substr($string, 0, strrpos(substr($string, 0, $length), ' '))) . $trimmarker : $string;
 return $newstring;
}

/* Использование */
echo internoetics_string_strrpos($string);

preg_match()

Вы редко найдете тех, кто предпочитает использовать регулярные выражения, когда есть так много отличных функций PHP. Тем не менее, вот функция, которая обрезает строку до определенного символа в PHP, исходя из заданного количества знаков от начала. В отличие от других функций, описанных выше, эта функция обрезает строку до целого слова.

/* 
	preg-match() 
	http://php.net/manual/en/function.preg-match.php
*/

function internoetics_preg_string($string, $length, $trimmarker = '...') {
  $strlen = strlen($string);
  /* mb_substr добавляет принудительный разрыв в $length, если заданное количество символов не содержит окончания слова (пробела) */
  $string = trim(mb_substr($string, 0, $strlen));
  if ($strlen > $length) {
   preg_match('/^.{1,' . ($length - strlen($trimmarker)) . '}\b/su', $string, $match);
   $string = trim($match['0']) . $trimmarker;
    } else {
   $string = trim($string);
  }
 return $string;
}

/* Применение */
echo internoetics_preg_string($string, 100, $trimmarker = '...');

Описание функции

Функция принимает три параметра: $string, $length и $trimmarker (многоточие или другие символы, которые добавляются в конце строки).

Строка 7

$strlen = strlen($string);

Первое, что мы делаем, это проверяем длину PHP обрезанной строки после символа. Если строка короче, чем $length, то мы возвращаем эту строку.

Строка 9

$string = trim(mb_substr($string, 0, $strlen));

Функция mb_substr() прерывает строку в $length, если это количество символов не содержит окончания слова (пробела). Если мы передали строку длиною 500 символов и эта строка не содержит пробелов, то будет возвращена вся строка (так как функция preg_match не нашла окончания слова). На данный момент мы обрезаем строку таким образом, и возвращаем ее полностью.

Строки 10, 11, и 12

Если длина нашей строки превышает максимальную длину, определенную в качестве параметра функции, мы выполняем регулярное выражение функции preg_match(), чтобы вернуть часть строки до символа с номером $length, который определяется как конец слова ('/^.{1,$length}\b/s'). Знак периода означает любой символ, кроме символа новой строки (\n). Фигурная скобка определяет диапазон, который задает, сколько символов должен PHP обрезать в строке. Таким образом {1,$length} означает от 1 до символа $length. Наконец, \b означает, что шаблон будет соответствовать окончанию слова. Мы можем производить поиск только слов целиком по шаблону, который мы предоставили. И в конце \s задает поиск всех пробелов.

Так как мы не хотим, чтобы возвращаемая строка превышала длину $length, максимальное количество символов в функции preg_match должно быть равно максимальной длине минус длина $trimmarke.r. Мы должны учитывать это.

Затем мы возвращаем либо усеченную строку, либо исходную строку, если она меньше заданной длины усечения.

strrpos()

Функция strrpos() находит позицию последнего вхождения подстроки в строке. Она возвращает позицию, на которой располагается искомая подстрока относительно начала строки. Отметим также, что первая позиция в строке имеет номер 0 - а не 1, поэтому мы учитываем это в функции, добавляя 1 к длине строки при применении функции strrpos().

/* 
	strrpos() 
	http://php.net/manual/en/function.strrpos.php
*/

function interneotics_short_string($string, $length, $trimmarker = '...') {
  $len = strlen($string);
  if ($len < $length) return $string;
   else;
  $string = substr($string, 0, $length + 1 - strlen($trimmarker));
  $string = trim(substr($string, 0, strrpos($string, ' ') + 1 )) . $trimmarker;
 return $string;
}

/* Использование */
echo interneotics_short_string($string, $length = 120);

wordwrap()

Использование wordwrap() - это еще один способ, с помощью которого можно в PHP обрезать строку до пробела, хотя он не очень эффективен и не является лучшим выбором (если только обстоятельства не требуют этого). Wordwrap оборачивает строку в заданное число символов с использованием символа разрыва строки. Применив функцию PHP explode(), мы можем построить массив из каждой строки текста. Мы определяем, нужен ли $trimmarker (конечное многоточие), запросив, пусто ли второе значение массива. Если пусто, то строка не оборачивается.

/* 
	wordwrap() 
	http://php.net/manual/en/function.wordwrap.php
*/

function internoetics_truncate_wordwrap($string, $length, $trimmarker = '...') {
  $lines = explode("\n", wordwrap($string, $length - strlen($trimmarker), "\n", true));
  $line = $lines['0'];
  $result = ($lines['1'] != '') ? $line . $trimmarker : $line;
 return $result;
}

/* Использование */
echo internoetics_truncate_wordwrap($string, 120, $trimmarker = '...');

Определение для параметра cut значения true означает, что строка всегда оборачивается до или на указанном символе.

str-split()

Функция str-split() может быть использована в приведенной выше функции для преобразования строки в массив. str-split () не разбивает строку до целого слова. С ее помощью PHP обрезает последний символ в строке ровно до 120 знаков.

/* 
	str-split() 
	http://php.net/manual/en/function.str-split.php
*/

function internoetics_truncate_split($string, $length, $trimmarker = '...') {
  $lines = str_split($string, $length - strlen($trimmarker));
  $line = rtrim($lines['0']);
  $result = ($lines['1'] != '') ? $line . $trimmarker : $line;
 return $result;
}

/* Использование */
echo internoetics_truncate_split($string, 120);

Усечение по заданному количеству слов

Ниже приведен пример PHP обрезки строки по количеству символов, пробелов или слов. Это не слишком отличается от того, что мы уже делали. Затем мы сводим скорректированный массив в строку символов, максимальное количество которых задается $limit. Мы добавляем $trimmarker (...), если наш $limit меньше, чем количество слов в массиве.

/* 
	Возвращаем количество слов, независимо от длины строки 
*/

$stringz = 'one two three four five six seven eight nine ten eleven twelve thirteen fourteen';
function internoetics_truncate_words($string, $limit = 10, $trimmarker = '...') {
  $count = str_word_count($string, 0);
  $string = explode(' ', $string, $limit + 1);
  array_pop($string);
  $string = implode(' ', $string);
 return ($limit < $count) ? $string . $trimmarker : $string;
}

/* Использование */
echo internoetics_truncate_words($stringz);

strtok()

Совместно применив strtok() и wordwrap() мы можем создать короткую, но эффективную функцию, которая будет в PHP обрезать строку до нужной длины. Как показано ниже, она не будет учитывать при усечении $length +$trimmarker. Но это удобно, если вы не слишком заботитесь о длине возвращаемой строки.

/*
	strtok()
	http://php.net/manual/en/function.strtok.php 
*/

function internoetics_strtok($string, $width = 120) {
 return strtok(wordwrap($string, $width, "...\n"), "\n");
}

/* Usage */
echo internoetics_strtok($string);

Обрезка слов в WordPress

Для возврата обрезанного слова в WordPress используется wp_trim_words. Данная функция часто применяется в сочетании с wp_strip_all_tags для очистки текста до его обработки. Конечно, есть и другие функции, которые служат для той же цели.

Заключение

Мы могли бы написать еще сотни примеров PHP обрезки строк, но когда-то нужно остановиться. Функции, приведенные в этой статье, являются частью ядра PHP, и вы можете использовать их для усечения строк. Хотя чаще всего программисты стараются избегать регулярных выражений, если другого выхода нет, вы можете прибегнуть и к их помощи.

В ряде примеров мы вернули $trimmarker, представляющий собой многоточие. При необходимости вы можете вернуть HTML-объект Ellipsis, для этого используется код …. Но лично я предпочитаю многоточие.

Скачать примеры

Скачать примеры из этой статьи вы можете здесь.

Перевод статьи «Truncate (Shorten) Strings to the Nearest Whole Word or Character Count with Trailing Dots using PHP Functions» был подготовлен дружной командой проекта Сайтостроение от А до Я.

22 мая 2016 в 13:29
Материалы по теме
{"url":"http://www.fastvps.ru/", "src":"/images/advbanners/fastvps.png", "alt":"Хостинг Fastvps.ru. Наш выбор!"}
Заработок