1. Kiểu dữ liệu Strings trong Python

Kiểu dữ liệu String trong Python là các ký tự hay một chuỗi gồm nhiều ký tự được đặt trong dấu nháy đơn hoặc đặt trong dấu nháy đôi. Ví dụ các chuỗi: ‘Xin chao’, “tailieutxd.com”….

Ta có thể sử dụng hàm print() để hiển thị giá trị chuỗi ra màn hình như sau:

print(“Xin chao”)
print(tailieutxd.com)

Kết quả:

Xin chao
tailieutxd.com

Ngoài cách hiển thị trực tiếp chuỗi từ hàm print(), ta có thể gán một chuỗi cho một biến bất kỳ và hiện thị biến đó ra màn hình.

Ví dụ gán các chuỗi: “Xin chao” và “tailieutxd.com” cho 2 biến x và y như sau:

#Khai bao va gan gia tri cho bien x, y
x = “Xin chao”
y = “tailieutxd.com”
 
#Hien thi ket qua
print(x)
print(y)

Kết quả:

 
Xin chao
tailieutxd.com

2. Truy cập ký tự trong chuỗi Python

Trong Python ta có thể truy cập các giá trị đơn lẻ của một chuỗi thông qua chỉ số (index). Các chỉ số cho phép tham chiếu tới địa chỉ các ký tự có trong chuỗi. Ví dụ chỉ số truy cập đến ký tự đầu tiên, 1 đề cập đến ký tự thứ hai….

Và ta có thể truy cập ngược lại từ cuối chuỗi về đầu chuỗi thông qua các chỉ số âm. Ví dụ như chỉ số -1 đề truy cập đến ký tự cuối cùng, -2 truy cập đến ký tự cuối cùng thứ hai, v.v.

#Khai bao va gan gia tri cho bien x, y
x = “tailieutxd.com”
 
#Hien thi ket qua
print(“Chuoi ban dau la: “)
print(x)
 
#Truy cap vao ky tu dau tien cua chuoi
print(“Ky tu dau tien cua chuoi la: “)
print(x[0])
 
#Truy cap vao ky tu cuoi cung cua chuoi
print(“Ky tu cuoi cung cua chuoi la: “)
print(x[-1])

Kết quả:

 
Chuoi ban dau la:
tailieutxd.com
Ky tu dau tien cua chuoi la:
L
Ky tu cuoi cung cua chuoi la:
m

Trong chuỗi “tailieutxd.com” bao gồm các chỉ số index như sau:

k h o a h o c . t o a n 2 4 7 . c o m
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
-19 -18 -17 -16 -15 -14 -13 -12 -11 -10 -9 -8 -7 -6 -5 -4 -3 -2 -1

Chú ý: Nếu truy cập vào chỉ số quá cao hoặc quá thấp (chỉ số không tồn tại trong chuỗi) thì sẽ gây ra lỗi IndexError.

Ví dụ truy cập vào chỉ số -20 (chỉ số này không tồn tại ở chuỗi trên) sẽ nhận kết quả như sau:

#Khai bao va gan gia tri cho bien x, y
x = “tailieutxd.com”
 
#Truy cap vao chi so -20 cua chuoi
print(“Ky tu cuoi cung cua chuoi la: “)
print(x[-20])

Kết quả:

IndexError: string index out of range

3. Thao tác với chuỗi ký tự trong Python

3.1 Lặp một chuỗi

Chuỗi ký tự thực chất cũng là một mảng, các ký tự đơn lẻ trong chuỗi được coi là một phần tử của mảng. Ta có thể sử dụng vòng lặp for trong Python để lặp một chuỗi.

Ví dụ chúng ta có chuỗi: “Hello” có thể lặp bằng vòng lặp for và hiển thị ra từng ký tự của chuỗi trên như sau:

for x in “Hello”:
print(x)

Kết quả:

H
e
l
l
o

3.2 Kiểm tra độ dài chuỗi

Để kiểm tra độ dài của một chuỗi bất kỳ, trong Python sẽ sử dụng hàm len(). Hàm len() sẽ đếm và coi chuỗi đó bắt đầu từ số 1 là ký tự đầu tiên.

Ví dụ kiểm tra độ dài của chuỗi: “Hello” sử dụng hàm len()

#Tao bien va gan chuoi
a = “Hello”
 
#Kiem tra do dai chuoi
print(len(a))

Kết quả:

5

3.3 Kiểm tra chuỗi con có tồn tại

Để kiểm tra xem một cụm từ (chuỗi con) hoặc ký tự nhất định có trong một chuỗi hay không, chúng ta có thể sử dụng từ khóa in

Ví dụ kiểm tra ký tự: “H” có tồn tại trong chuỗi “Hello” hay không như sau:

#Tao bien va gan chuoi
a = “Hello”
 
#Kiem tra ky tu co ton tai trong chuoi khong
print(“H” in a)

Kết quả:

True
Ví dụ tiếp theo, kiểm tra chuỗi con “” có tồn tại trong chuỗi “tailieutxd.com” hay không như sau:
#Tao bien va gan chuoi
a = “tailieutxd.com”
 
#Kiem tra ky tu co ton tai trong chuoi khong
print(“khoahoc” in a)

Kết quả:

True

Để kiểm tra xem một cụm từ (chuỗi con)  hoặc ký tự nào đó KHÔNG có trong một chuỗi hay không, chúng ta có thể sử dụng từ khóa not in

Ví dụ kiểm tra chuỗi con “tudau” có KHÔNG nằm trong chuỗi “tailieutxd.com” hay không như sau:
#Tao bien va gan chuoi
a = “tailieutxd.com”
 
#Kiem tra ky tu co khong ton tai hay khong
print(“tudau” not in a)

Kết quả:

False

Ví dụ tiếp theo, kiểm tra chuỗi con “abc” có KHÔNG nằm trong chuỗi “tailieutxd.com” hay không như sau:

#Tao bien va gan chuoi
a = “tailieutxd.com”
 
#Kiem tra ky tu co khong ton tai hay khong
print(“abc” not in a)

Kết quả:

True

4. Một số ký tự điều khiển trong Python

Các ký tự điều khiển được sử dụng để điều hướng một chuỗi trong Python, các ký tự điều khiển có thể là tăng độ dài khoảng cách của chuỗi, xuống dòng cho một chuỗi, ngắt câu cho chuỗi….

Dưới đây là bảng các ký tự điều khiển cho chuỗi trong Python

Ký tự Mô tả
\’ Sử dụng hiển thị dấu nháy đơn trong chuỗi
\\ Sử dụng dấu \ trong chuỗi
\n Xuống dòng mới cho chuỗi
\r Xuống dòng cho mới cho một từ
\t Cách ra một khoảng tab
\b Xóa bỏ khoảng cách giữa hai từ

Ví dụ cách sử dụng các ký tự điều khiển ở bảng trên như sau:

# Ky tu \’
text = ‘\’Xin\’ Chao’
print(text)
 
# Ky tu \\
text = ‘Xin\\Chao’
print(text)
 
# Ky tu \n
text = ‘Xin Chao\nDay la tailieutxd.com’
print(text)
 
# Ky tu \r
text = ‘Xin\rChao’
print(text)
 
# Ky tu \t
text = ‘Xin\tChao’
print(text)
 
# Ky tu \b
text = ‘Xin\bChao’
print(text)

Kết quả:

‘Xin’ Chao
Xin\Chao
Xin Chao
Day la tailieutxd.com
Xin
Chao
Xin    Chao
XinChao

5. Một số hàm xử lý chuỗi trong Python