以下函数用于对 dtype 为 numpy.string_ 或 numpy.unicode_ 的数组执行向量化字符串操作。 它们基于 Python 内置库中的标准字符串函数。

这些函数在字符数组类(numpy.char)中定义。

add() 对两个数组的逐个字符串元素进行连接
multiply() 返回按元素多重连接后的字符串
center() 居中字符串
capitalize() 将字符串第一个字母转换为大写
title() 将字符串的每个单词的第一个字母转换为大写
lower() 数组元素转换为小写
upper() 数组元素转换为大写
split() 指定分隔符对字符串进行分割,并返回数组列表
splitlines() 返回元素中的行列表,以换行符分割
strip() 移除元素开头或者结尾处的特定字符
join() 通过指定分隔符来连接数组中的元素
replace() 使用新字符串替换字符串中的所有子字符串
decode() 数组元素依次调用str.decode
encode() 数组元素依次调用str.encode

 

numpy.char.add() 函数依次对两个数组的元素进行字符串连接。

numpy.char.multiply() 函数执行多重连接。

numpy.char.multiply() 函数执行多重连接。

numpy.char.capitalize() 函数将字符串的第一个字母转换为大写。

numpy.char.title() 函数将字符串的每个单词的第一个字母转换为大写。

numpy.char.lower() 函数对数组的每个元素转换为小写。它对每个元素调用 str.lower。

numpy.char.upper() 函数对数组的每个元素转换为大写。它对每个元素调用 str.upper。

numpy.char.split() 通过指定分隔符对字符串进行分割,并返回数组。默认情况下,分隔符为空格。

numpy.char.split() 通过指定分隔符对字符串进行分割,并返回数组。默认情况下,分隔符为空格。

numpy.char.join() 函数通过指定分隔符来连接数组中的元素或字符串。

numpy.char.replace() 函数使用新字符串替换字符串中的所有子字符串。

numpy.char.encode() 函数对数组中的每个元素调用 str.encode 函数。 默认编码是 utf-8,可以使用标准 Python 库中的编解码器。

numpy.char.encode() 函数对数组中的每个元素调用 str.encode 函数。 默认编码是 utf-8,可以使用标准 Python 库中的编解码器。

import numpy as np

print("numpy.char.add()")
print(np.char.add(['hello'],[' world']))
print(np.char.add(['he','wor'],['llo','ld']))

print("numpy.char.multiply()")
print(np.char.multiply(['hello '],3))
print(np.char.multiply(['hello ','world '],3))

print("numpy.char.center()")
print(np.char.center(['hello'], 10, fillchar='*'))

print("numpy.char.capitalize()")
print(np.char.capitalize('hello world'))
print(np.char.capitalize(['hello', 'world']))

print("numpy.char.title()")
print(np.char.title('hello world'))

print("numpy.char.lower()")
print(np.char.lower('HELLO WORLD'))

print("numpy.char.upper()")
print(np.char.upper('hello world'))

print("numpy.char.split()")
print(np.char.split('hello world', sep=' '))

print("numpy.char.splitlines()")
print(np.char.splitlines('hello\nworld'))

print("numpy.char.strip()")
print(np.char.strip(['**hello',' world**'], '*'))

print("numpy.char.join()")
print(np.char.join('-', 'hello' ))

print("numpy.char.replace()")
print(np.char.replace('hello world', 'world', 'universe'))

print("numpy.char.encode()")
print(np.char.encode('hello world', 'utf-8'))

print("numpy.char.decode()")
print(np.char.decode(b'hello world', 'utf-8'))
numpy.char.add()
['hello world']
['hello' 'world']
numpy.char.multiply()
['hello hello hello ']
['hello hello hello ' 'world world world ']
numpy.char.center()
['**hello***']
numpy.char.capitalize()
Hello world
['Hello' 'World']
numpy.char.title()
Hello World
numpy.char.lower()
hello world
numpy.char.upper()
HELLO WORLD
numpy.char.split()
['hello', 'world']
numpy.char.splitlines()
['hello', 'world']
numpy.char.strip()
['hello' ' world']
numpy.char.join()
h-e-l-l-o
numpy.char.replace()
hello universe
numpy.char.encode()
b'hello world'
numpy.char.decode()
hello world