Cách tách một chuỗi trong Python

Cách tách một chuỗi trong Python

Tách một chuỗi trong Python khá đơn giản. Bạn có thể đạt được điều này bằng cách sử dụng hàm 'split ()' tích hợp sẵn của Python.





Các tách ra() trong Python phân tách từng từ trong một chuỗi bằng dấu phẩy, biến nó thành danh sách các từ. Hướng dẫn này sẽ hướng dẫn bạn các cách khác nhau để bạn có thể tách một chuỗi trong Python.





màn hình xanh sau khi cửa sổ ngủ 10

Cách sử dụng phương pháp phân tách Python

Như đã đề cập trước đó, theo mặc định, Python được tích hợp sẵn tách ra() hàm ngắt một chuỗi thành các từ riêng lẻ được phân tách bằng dấu phẩy. Nhưng nó chấp nhận hai đối số tùy chọn và đây là cú pháp trông như thế nào:





string.split([separatng criteria], [break point or max_split])

Khi bạn chỉ định một tiêu chí tách biệt , hàm định vị tiêu chí đó trong chuỗi và bắt đầu phân tách tại thời điểm đó. Nếu không, theo mặc định, nó chia chuỗi ở bất kỳ đâu có khoảng trắng.

Hãy xem ví dụ dưới đây để xem cách này hoạt động như thế nào. Ở đây, các khoảng trắng là tiêu chí phân tách theo mặc định, vì chúng tôi không chỉ định một:



myTexts = 'How to split a text in Python'
splitString = myTexts.split()
print(splitString)
Output: ['How', 'to', 'split', 'a', 'text', 'in', 'Python']

Hãy xem làm thế nào tách ra() phương pháp hoạt động khi bạn chỉ định tiêu chí phân tách. Trong ví dụ này, dấu phẩy là tiêu chí phân tách:

myTexts = 'How to split, a text in, Python'
print(myTexts.split(', '))

Để nắm rõ hơn, đoạn mã ví dụ dưới đây sẽ chia các chuỗi bất cứ nơi nào có dấu chấm. Vì vậy, các dấu chấm ở đây là tiêu chí phân tách:





myTexts = 'How to split.a text in.Python'
print(myTexts.split('.'))
Output: ['How to split', 'a text in', 'Python']

max_split là một số nguyên chỉ định số lần ngắt tối đa trong một chuỗi. Quan trọng hơn, nó chỉ ra điểm mà chuỗi bị đứt.

Vì vậy, bạn có thể bao gồm giá trị đó trong dấu ngoặc đơn để ngắt chuỗi tại các điểm cụ thể.





Ví dụ: đoạn mã dưới đây chia văn bản thành hai và dừng ở dấu phẩy thứ hai:

myTexts = 'How, to, split, a, text, in, Python'
print(myTexts.split(', ', 2))
Output: ['How', 'to', 'split, a, text, in, Python']

Để xem cách này hoạt động thêm, hãy tách chuỗi trong mã bên dưới, làm cho nó dừng lại ở dấu chấm thứ hai:

myTexts = 'How.to split.a text.in.Python'
print(myTexts.split('.', 2))
Output: ['How', 'to split', 'a text.in.Python']

Trong khi tách ra() phương pháp không ngắt các chuỗi thành các bảng chữ cái, bạn có thể đạt được điều này bằng cách sử dụng vòng:

myTexts = 'How to split a text in Python'
Alphabets = []
for each in myTexts:
alphas = each
Alphabets.append(alphas)
print(Alphabets)

Có liên quan: Cách nối danh sách bằng Python

Thay vì thêm vào một danh sách như chúng tôi đã làm trong đoạn mã trên, bạn có thể rút ngắn mã bằng cách sử dụng một cách hiểu danh sách :

y = [each for each in myTexts]
print(y)

Tạo bộ đếm từ với chức năng phân tách trong Python

Bạn có thể sử dụng Python tách ra() theo nhiều cách. Ví dụ: bạn có thể đếm số từ sau khi tách từng chuỗi:

myTexts = 'How to split a text in Python'
print(len(myTexts.split()))
Output: 7

Sửa đổi mã ở trên để đếm các từ trong một tệp riêng biệt. Bạn có thể tạo một hàm để thực hiện việc này. Nhưng ở đây, bạn cần mở và đọc tệp chứa văn bản.

Sau đó, tách văn bản trước và thực hiện đếm bằng cách trả về độ dài của phần tách kết quả bằng cách sử dụng len () hàm số:

def countWords(file):
myFile = open(file, 'r')
File = myFile.read()
splitString = File.split()
return len(splitString)
print(countWords('[Path to Yourfile.txt]'))

Mặc dù hơi phức tạp nhưng bạn cũng có thể làm điều này bằng cách sử dụng chỉ vòng lặp:

def countWords(file):
myFile = open(file, 'r')
File = myFile.read()
File = [File]
for files in File:
return files.count(' ') + 1
print(countWords('[Path to Yourfile.txt]'))

Có liên quan: Cách mở, đọc và ghi vào tệp bằng Python

Để làm cho đọc từng từ riêng biệt, bạn nên chèn tệp của mình vào một danh sách riêng như chúng ta đã làm trong đoạn mã trên. Ngoài ra, thực thi số lượng từ bằng cách để lại khoảng cách giữa các dấu ngoặc kép trống trong ngoặc đơn. Nếu không, nó cung cấp cho bạn kết quả sai.

Vì vậy, mã hoạt động bằng cách đếm khoảng cách giữa mỗi từ và sau đó thêm 1 vào tổng số để có được số từ thực tế.

Đơn giản hóa mã của bạn

Các tách ra() function là một công cụ Python có giá trị và như bạn đã thấy, bạn có thể sử dụng nó để đếm các từ trong một tệp. Bạn thậm chí có thể giải quyết các vấn đề khác với nó như bạn mong muốn. Có rất nhiều hàm tích hợp sẵn khác trong Python như thế này giúp đơn giản hóa các hoạt động phức tạp một cách nhanh chóng và hiệu quả.

Vì vậy, thay vì viết các khối mã dài, việc thử các phương pháp tích hợp sẵn hiệu quả hơn, đơn giản hơn và nhanh hơn để giải quyết các vấn đề mã hóa khác nhau luôn hữu ích. Điều đó nói rằng, có nhiều cách khác để thao tác chuỗi ngoài việc tách. Bạn luôn có thể dùng thử chúng để cải thiện khả năng xử lý chuỗi của mình bằng Python.

Đăng lại Đăng lại tiếng riu ríu E-mail Học Python? Đây là cách thao tác chuỗi

Việc sử dụng và thao tác các chuỗi trong Python có thể có vẻ khó khăn, nhưng nó rất đơn giản.

Đọc tiếp
Chủ đề liên quan
  • Lập trình
  • Python
  • Hướng dẫn viết mã
Giới thiệu về tác giả Idisou Omisola(Đã xuất bản 94 bài báo)

Idowu đam mê mọi thứ về công nghệ và năng suất thông minh. Trong thời gian rảnh rỗi, anh ấy chơi mã hóa và chuyển sang bàn cờ khi anh ấy buồn chán, nhưng anh ấy cũng thích thoát khỏi thói quen đôi khi. Niềm đam mê của anh ấy trong việc chỉ ra cho mọi người cách thức xung quanh công nghệ hiện đại đã thúc đẩy anh ấy viết nhiều hơn.

Xem thêm từ Idowu Omisola

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký