Table of Content

Important

Tham khảo

1. Xử lý tập tin văn bản

  • Tập tin .txt (không phải MS word file)
    • Ứng dụng:
      • Trong NLP
      • Khi debug loop thì ta xuất các giá trị kết quả về .txtx
  • Không có cấu trúc, dãy liên tục các ký tự.
  • \n ở cuối mỗi dòng

Khai thác tập tin văn bản:

  • Mở, đóng tập tin:

    • Mở file: Hệ điều hành chép bản sao của file lên RAM → Các thao tác được thực hiện trên RAM.
    • Đóng file: Chép từ RAM về đĩa cứng
  • Truy cập (đọc/ghi) dựa trên vị trí của con trỏ (pointer)

  • Đọc:

  • Ghi:

2. Regular expression (RegEx)

1. Regex

3. Xử lý tập tin excel

M03W1.3_Pandas cơ bản