Методы строк в Python
Список строковых методов, доступных в Python 3.
Метод
Описание
Примеры
Возвращает копию строки, в которой первая буква переведена в верхний регистр (заглавная), а остальные — в нижний (строчные).
Все пространство, не заполненное центральной строкой, заполняется символами, заданными в параметре fillchar (по умолчанию используется пробел ASCII).
Если указанная ширина строки меньше, чем ширина исходной строки ( len(s) ), или равна ей, возвращается исходная строка.
Метод возвращает число вхождений указанной подстроки sub в строку в заданном промежутке ( [start, end] ).
Аргументы для определения начала и конца промежутка опциональны и интерпретируются как обозначение среза.
При подсчете учитываются непересекающиеся вхождения. Это означает, что Python не будет заново прибавлять символы, которые уже были посчитаны.
Например, если у вас есть строка хххх и вы хотите подсчитать, сколько в ней вхождений подстроки ххх, то в результате получите 1.
Возвращает декодированную версию строки в качестве байтового объекта. Кодировка по умолчанию — utf-8.
При помощи параметра errors можно задавать разные наборы схем обработки ошибок. Возможны следующие варианты:
strict (ошибки декодирования вызывают UnicodeError )
любое другое слово, зарегистрированное через codecs.register_error()
Суффикс также может быть кортежем суффиксов.
При указании аргумента end проверка останавливается на указанном символе. Оба аргумента опциональны.
Возвращает первый индекс в строке, на котором была найдена указанная подстрока.
Можно указать диапазон поиска при помощи опциональных аргументов start и end (они интерпретируются как срез).
При помощи этого метода можно отформатировать строку.
Строка, относительно которой вызывается этот метод, может содержать простой текст или места для подстановки, обозначенные фигурными скобками.
Каждое место для подстановки содержит или числовой индекс позиционного аргумента, или имя именованного аргумента.
Метод возвращает строку, в которой каждое поле подстановки заменено строковым значением соответствующего аргумента.
Tea and Coffee
Coffee and Tea
Peas and Beans
1, 2, 3
Lunch: Pizza, Wine
Lunch: Pizza, Wine
Lunch: Pizza, Drink
Lunch: Food, Wine
3
3
4
ValueError: substring not found
Значение переменной c считается буквенно-цифровым, если хотя бы одно из выражений возвращает True :
Примечание. Имейте в виду, что под «буквенными» символами понимаются символы, определенные в базе данных Unicode как «буква», т. е., относящиеся к любой из категорий «Lm», «Lt», «Lu», «Ll» и «Lo».
К десятичным символам относятся символы, с помощью которых можно формировать числа в десятичной системе счисления. В Unicode эти символы относятся к общей категории «Nd».
Разницу между методами isdigit() и isdecimal() можно увидеть, если посмотреть, как они работают со вторым примером (u»\u00B2″).
Речь идет о символах, которые в принципе могут быть как в нижнем, так и в верхнем регистре, т. е., относящихся к одной из общих категорий «Lu», «Ll» или «Lt».
Чтобы перевести строку в нижний регистр, можно использовать метод casefold() (это показано в последнем примере).
К непечатаемым символам относятся символы, определенные в базе данных Unicode как «Other» или «Separator», за исключением пробела ASCII (0x20), который считается печатаемым.
К символам пробелов относятся те, который в базе данных Unicode определены как «Other» или «Separator» и имеют двунаправленное свойство «WS», «B» или «S».
Речь идет о символах, которые в принципе могут быть как в нижнем, так и в верхнем регистре, т. е., относящихся к одной из общих категорий «Lu», «Ll» или «Lt».
Возвращает строку, которая является конкатенацией строк в итерируемом объекте.
Разделителем между элементами служит заданная строка.
Возвращает строку, выровненную по левому краю в рамках большей строки (ее ширина в символах задается при помощи параметра width ).
Если заданная ширина строки меньше или равна длине оригинальной строки (определяется при помощи len(s) ), то возвращается оригинальная строка.
Возвращает копию строки, в которой все символы переведены в нижний регистр.
Разумеется, речь идет о символах, которые в принципе могут быть как в верхнем, так и в нижнем регистре.
Возвращает копию строки с удаленными первыми символами (т.е., символами, стоящими слева).
Обратите внимание, что в качестве аргумента задается не префикс, а именно набор символов, т. е., их порядок не имеет значения. Метод будет удалять все символы из набора, двигаясь слева направо, пока не достигнет первого символа, не входящего в набор.
Разделяет строку в месте первого вхождения заданного разделителя ( sep ) и возвращает кортеж из трех элементов: части строки до разделителя, самого разделителя и части строки после него.
Если заданный разделитель не найден, метод опять же возвращает кортеж из трех элементов, где первым элементом будет вся неразделенная строка, за которой будут идти две пустые строки.
Coffee bag. Coffee cup. Coffee leaves.
Coffee bag. Coffee cup. Tea leaves.
Возвращает самый большой индекс в строке, на котором была найдена указанная подстрока.
8
10
9
ValueError: substring not found
ValueError: substring not found
ValueError: substring not found
Возвращает строку, выровненную по правому краю в рамках большей строки (ее ширина в символах задается при помощи параметра width ).
Если символ-заполнитель не задан, по умолчанию будут использоваться ASCII пробелы.
В случае, если заданная ширина строки меньше или равна длине оригинальной строки (определяется при помощи len(s) ), возвращается оригинальная строка.
Разделяет строку в месте последнего вхождения заданного разделителя ( sep ) и возвращает кортеж из трех элементов: части строки до разделителя, самого разделителя и части строки после него.
Если заданный разделитель не найден, метод опять же возвращает кортеж из трех элементов, где двумя первыми элементами будут пустые строки, а последним — неразделенная исходная строка.
(‘Homer-Jay’, ‘-‘, ‘Simpson’)
(», », ‘Homer-Jay-Simpson’)
Возвращает список слов в строке, используя sep в качестве разделителя.
Разделитель можно не задавать или указать None — в таком случае разделителем будет считаться любой пробел (или подстрока из пробелов).
[‘Homer’, ‘Jay’, ‘Simpson’] [‘Homer-Jay’, ‘Simpson’]
Возвращает копию строки с удаленными последними символами (т.е., символами, стоящими справа).
Обратите внимание, что в качестве аргумента задается не суффикс, а именно набор символов, т. е., их порядок не имеет значения. Метод будет удалять все символы из набора, двигаясь справа налево, пока не достигнет первого символа, не входящего в набор.
Этот метод разбивает заданную строку на отдельные слова и возвращает список этих слов.
Строка-разделитель задается при помощи параметра sep.
[‘Homer’, ‘Jay’, ‘Simpson’] [‘Homer’, ‘Jay-Simpson’] [‘Homer’, », ‘Bart’, »] [‘Homer’, ‘,Bart’] [‘Homer’, ‘Bart’, ‘Marge’]
Если у вас есть многострочная строка, где строчки разделены, например, символами переноса строки, этот метод может вернуть список строчек, из которых состоит ваша строка.
Этот метод делит строку по следующим экранированным последовательностям:
\r — возврат каретки;
\r\n — возврат каретки + перевод строки;
\v или \x0b — вертикальная табуляция;
\f или \x0c — разрыв страницы;
\x1c — разделитель файлов;
\x1d — разделитель групп;
\x1e — разделитель записей;
\x85 — следующая строка;
\u2028 — разделитель строк;
\u2029 — разделитель абзацев.
[‘Tea’, », ‘and coffee’, ‘cups’] [‘Tea\n’, ‘\n’, ‘and coffee\r’, ‘cups\r\n’]
Префикс также может быть кортежем префиксов.
Обратите внимание, что в качестве аргумента задается не префикс или суффикс, а именно набор символов, т. е., их порядок не имеет значения. Метод будет удалять все символы из набора, двигаясь и слева направо, и справа налево, пока с каждой стороны не достигнет первого символа, не входящего в набор.
Возвращает копию строки, в которой все символы, стоящие в верхнем регистре, переведены в нижний, и наоборот.
Обратите внимание, что повторное применение метода swapcase() не всегда вернет строку в первоначальном виде.
Есть такие комбинации, когда двум разным символам в нижнем регистре соответствует один символ в верхнем, так что «переключение» регистра может дать неожиданный эффект. Примеры можно посмотреть в обсуждении на Stack Overflow.
Возвращает копию строки в формате заголовка (когда каждое слово в строке начинается с заглавной буквы, а все остальные — строчные).
Tea And Coffee
Tea And Coffee
Возвращает переведенную копию строки, в которой каждый символ преобразован по правилам, прописанным в таблице перевода.
Возвращает копию строки, которая приведена к указанной длине (задается при помощи параметра width ).
Если исходная строка короче указанной длины, «пустота» заполняется нулями ASCII слева.
Знаки +/- указываются в исходной строке и учитываются при подсчете ее длины.
Adblockdetector







