Python数据类型之字符串

2023-11-08 22:07•python•阅读 4183

Python中的字符串的一些概念

可以看作是字符的集合，在数据类型里没有单个字符的数据类型，可以用单个字符表示的一个字符串数据类型
字符串是一种不可变的序列类型，单个字符从左到右按照顺序排列，同时修改某个位置的字符是不被允许的
在Python3中，字符串可以分为三类，str用于Unicode文本，bytes用于二进制数据，bytearray是bytes的一种可变的变体

1.1 字符串的创建

通过单引号，双引号，三引号来创建一个字符串对象，本质上单引号和双引号及三引号的作用是一样的。

name1 = 'wangys'
name2 = "wangys"
name3 = '''wangys'''

使用单引号，双引号及三引号本质是一样的，都可以创建一个字符串对象

1.2 其他

也可以将不同的字串进行合并，字串之间使用空格，作用类似于 +号操作

name = 'wa' "ng" '''ys'''
print(name)
# wangys

name = 'wa',"ng",'''ys''' # 如果之间使用逗号，会组成一个元祖
print(name)
('wa', 'ng', 'ys')

二：基本操作

索引
分片
乘法
判断是否包含值
长度
最大值
最小值

2.1 字符串索引及切片

字符串时有序字符集合，可以通过位置（索引）找到相应的元素
Python中字符的偏移量是左到右开始计数的，从0开始，到字符串长度-1，也可以通过负数取得，负数偏移量跟这个字符串的长度之和就是这个字符的正偏移量
表示方法是一对[]括号将偏移量写入即可得到该偏移量的字符
分片时使用冒号分隔，切片结果包括左边界，不包括右边界，即顾头不顾尾
分片时如果忽略了边界，左边界从0开始，右边界到字符串长度-1结束即到字符串的结尾并包括这个结尾
分片时如果指定了步进数，意思是每隔步进数取一个索引值
切片操作不仅仅对字符串有效，对元祖及列表也是一样的
如果索引过界,通过索引取值时会报错

2.1.1 索引

name = 'wangys'
print(name[0])
print(name[2])
print(name[-1])
print(name[-3])
# w
# n
# s
# g

2.1.2 分片（slice）

name = 'wangys'
# 没有定左右边界，则包括整个字符串
print(name[:])
# wangys
# 没有定左边界，则从0开始
print(name[:3])
# wan
# 如果没有定右边界，则到字符串的结尾
print(name[1:])
# angys

#左右都定了边界，顾首不顾尾

print(name[1:-1])

# angy


# 左右都定了边界，顾首不顾尾
print(name[1:3])
an

name = 'wangys'
# 步长默认情况
print(name[::1])
# 返回取整个字符串
print(name[::-1])
# 偏移量从1到5没隔2步取一个索引
print(name[1:5:2])
# 偏移量从5到1 每隔2步取一个索引
print(name[5:1:-2])

2.2 字符串拼接“+”

first_name = 'jack'
second_name = 'john'

name = first_name+' '+second_name
print(name)
# jack john
# 仅限字符串凭借，当使用数字类型时会报错

name = 'wangys'
age = 18
info = name+age
print(info)
# TypeError: must be str, not int

name = 'wangys'
age = '18'
info = name+age
print(info)
# wangys18

2.3 字符串多复制*

name = 'wangys'
ret = name*3
print(ret)
# wangyswangyswangys

print('-'*8)
--------

2.4 计算字符串的长度

# 使用len函数计算字符串中字符的个数
name = 'wangys'
print(len(name))
# 6

2.5 循环遍历整个元素

name = 'wangys'
for i in name:
    print(i,end=' ')

# w a n g y s

2.6 in操作

info = 'I love you'
print('love' in info)
print('you' not in info)
# True
# False

2.7 max min

按照ASCII计算最大和最小值

name = 'wangys'
print(max(name))
print(min(name))
#y
# a

三：字符串常用的操作

3.1 center

将字符串居中显示
有两个参数，第一个参数是整个字符串的长度，第二个参数是填充字符串（长度为1）

name = 'wangys'
print(name.center(30,'*')) # 长度30，不够使用*填充
# ************wangys************

name = 'wangys'
print(name.center(30,'*#')) # 填充字符必须是长度为1的字符
# TypeError: The fill character must be exactly one character long

name = 'wangys'
print(name.center(30)) # 默认用空格填充
#             wangys

3.2 strip

strip 默认删除两边的空白,空白包括空格,制表符,换行符等.
插在中间的空格不会删掉，也可以制定删除的特殊符号，但还是哪个原则，插在中间的并不删除
lstrip 删除左边
rstrip 删除右边

name = input('请输入你的名字：')
if name == 'wangys':
    print('你好啊')

name = input('请输入你的名字：').strip()
if name == 'wangys':
    print('你好啊')

name = ' #wan#gys*'
print(name.strip(' #*'))

name = ' wangys '
print(name.lstrip())
print(name.rstrip())

3.3 startswith/endswith

以什么为开头,以什么结尾

name = 'wangys'
print(name.startswith('wa'))
print(name.startswith('ng',2,5))
print(name.endswith('ys'))

应用：判断请求，以哪个字符串开始，或者结尾

name = 'wangys'
if name.startswith('wa'):
    pass
elif name.startswith('ll'):
    pass

import os
files = os.listdir('.')
# 找出已py文件结尾的文件
py_files = [file for file in files if file.endswith('.py')]
print(py_files)
# 找出以py或者以sh结尾的文件 多个条件过滤时使用元祖条件（必须是元祖）
py_sh_files = [file for file in files if file.endswith(('.py', '.sh'))]
print(py_sh_files)

3.4 find

找匹配得子字符串得索引
如果找到就将找到得第一个符合匹配得子字符串索引返回，如果找不到就返回-1
可以指定起始和结束位置进行查找

s = 'hello world'
print(s.find('world'))
# 6

# 找到了就不会再往后找了
s = 'hello world'
print(s.find('o'))
# 4

# 第二个参数表示从第7个字符开始查找
s = 'hello world'
print(s.find('o',6))
# 7

# 表示从7到10之间得字符查找
s = 'hello world'
print(s.find('o',7,10))
# 7

# 如果找不到就返回-1
s = 'hello world'
print(s.find('o',10,18))
# -1

# 用户输入大字符串，循环找出用户输入的字符串的位置
s = input('请输入大的字符串：')

while True:
    subString = input('请输入要查询的子字符串：')

    if subString.lower() == 'end':
        break
    elif subString:
        start = 0
        end = len(s)
        while True:
            startPostion = input('请输入开始查找的位置：')
            if startPostion == '':
                startPostion = start
            elif startPostion.isdigit():
                startPostion = int(startPostion)
                break
            else:
                print('请输入数字')
                continue
        while True:
            stopPostion = input('请输入结束查找的位置：')
            if stopPostion == '':
                stopPostion = end
            elif stopPostion.isdigit():
                stopPostion = int(stopPostion)
                break
            else:
                print('请输入数字')
                continue
        index = s.find(subString,startPostion,stopPostion)
        if index == -1:
            print('没找到')
        else:
            print("'{}' 在 '{}'出现的位置是{}".format(subString,s,s.find(subString,startPostion,stopPostion)))
    else:
        print('请不要输入空字符串')

3.5 index

找出子字符串的索引位置
如果找不到就报错

name = 'wangys'
print(name.index('a'))
print(name.index('angy'))
print(name.index('lala'))

# 1
# 1
# ValueError: substring not found

3.6 split

将字符串进行切割
于join方法互为逆方法，将字符串生成列表类型
默认以空格，制表符，换行符作为分隔符,也可以指定切割符

path = '/usr/local/nginx'
listPath = path.split('/')
print(listPath)
s = r'\\'
windowsPath = s.join(listPath)
print('C:'+windowsPath)
# ['', 'usr', 'local', 'nginx']

# C:\\usr\\local\\nginx

3.7 capitalize

首字母大写

name = 'wangyongsheng'
name = name.capitalize()
print(name)
# Wangyongsheng

不论字符串里是否有大写字母，都会将首字母大写，其他的都是小写

name = "WangYS"
name = name.capitalize()
print(name)
# Wangys

3.8 upper/lower

全部大写

name = 'wangys'
name = name.upper()
print(name)

全部小写

name = 'WangYongSheng'
name = name.lower()
print(name)

应用：比如说验证码校验，对用户输入不区分大小写

code_num = 'WangYs'
input_num = input("请输入验证码，不区分大小写：")
if code_num.lower() == input_num.lower():
    print("输入正确")
else:
    print("请重新输入")

3.9 swapcase

name = 'WangYs'
name = name.swapcase()
print(name)

3.10 title

将以空格或者其他特殊字符或者数字隔开的字符串首字母大写

name = 'wang yong sheng'
name = name.title()
print(name)

name = 'wang*yong-sheng'
name = name.title()
print(name)

3.11 replace

字符串是不可变数据类型，所谓修改并不是在本身上做修改，而是生成了一个新的字符串。
可以使用replace进行修改

msg = 'wangys wangys'
print(msg.replace('wangys','wc'))
print(msg.replace('wangys','wc',1))

# wc wc

# wc wangys

3.12 count

1: 如果多个，就返回一个数

2：如果没有，返回0

3：可以切片后再进行计数

msg = 'My name is wangys'
print(msg.count('a'))
print(msg.count('x'))
print(msg.count('wangys'))
print(msg.count('a',2,5))

3.13 isdigit/isalnum/isalpha

isdigit 判断字符串只有数字组成
isalpha 判断字符串只有字母组成
isalnum 判断字符串是否有数字和字母组成

msg = 'wangys123'
print(msg.isalnum()) #字符串由字母或数字组成
print(msg.isalpha()) #字符串只由字母组成
print(msg.isdigit()) #字符串只由数字组成

四 :字符串格式化

4.1 %s %d

name = input("姓名：")
age = int(input("年龄："))
height = int(input("身高："))

msg = '''
-------- Info of %s ---------
姓名：%s
年龄：%d岁
身高：%scm
''' % (name,name,age,height)

print(msg)

4.2 {} 按照位置

name = input("姓名：")
age = int(input("年龄："))
height = int(input("身高："))

msg = '''
-------- Info of {} ---------
姓名：{}
年龄：{}岁
身高：{}cm
'''.format(name,name,age,height)

print(msg)

4.3 {} 按照指定位置

name = input("姓名：")
age = int(input("年龄："))
height = int(input("身高："))
msg = '''
-------- Info of {1} ---------
姓名：{1}
年龄：{2}岁
身高：{3}cm
'''.format(name,name,age,height)
print(msg)

4.4 {} 按照关键字

name = input("姓名：")
age = int(input("年龄："))
height = int(input("身高："))

msg = '''
-------- Info of {name} ---------
姓名：{name}
年龄：{age}岁
身高：{height}cm
'''.format(name=name,age=age,height=height)

print(msg)

五：其他操作

1：利用int或者float进行类型转换

a = 1
b = '2'
print(a+b) # 字符串无法跟数字相加
TypeError: unsupported operand type(s) for +: 'int' and 'str' # 报错

a = 1
b = '2'
b = int(b)  # 可以通过int()函数将字符串数字转换为数字，然后进行运算
print(a+b)
# 3

2: len函数

去字符串字符的长度

name='wangys'
print(len(name))

遍历字符串

根据索引

name='wangys'

count = 0
while count < len(name):
    print(name[count])
    count +=1

for 循环

for 变量 in 可迭代对象

name = 'wangys'
for i in name:
    print(i)

3 join 方法

该方法用于连接序列中的方法
跟split方法正好相反
join方法只能用于字符串类型，如果是其他数据类型，则会报错

list = ['1','2','3']
s = '+'
ret = s.join(list)
print(ret)
# 1+2+3

dir = ['','usr','local','nginx']
linux_s = '/'
linuxPath = linux_s.join(dir)
windows_s=r'\\'
windowsPath = windows_s.join(dir)
print(linuxPath)
print('C:'+windowsPath)
# /usr/local/nginx
# C:\\usr\\local\\nginx


list = [1,2,3,4,5]
s = '+'
print(s.join(list))
# TypeError: sequence item 0: expected str instance, int found

上一篇 »Python之基本数据类型与数据结构
下一篇 »python之json笔记