Thêm cột vào DataFrame trong Pandas - 5 phương pháp

Try Proseoai — it's free
AI SEO Assistant
SEO Link Building
SEO Writing

Thêm cột vào DataFrame trong Pandas - 5 phương pháp

Mục lục

  1. Giới thiệu về Pandas
  2. Cách thêm cột mới vào DataFrame
    • 2.1. Sử dụng phương thức gán cột (Assign a Column)
    • 2.2. Sử dụng phương thức insert
    • 2.3. Sử dụng phương thức df.insert
    • 2.4. Sử dụng phương thức loc
    • 2.5. Phương pháp không được khuyến nghị
  3. Những lưu ý khi thêm cột vào DataFrame
  4. Kết luận
  5. Tài liệu tham khảo

Cách thêm cột mới vào DataFrame trong Pandas 🐼

Trong quá trình làm việc với dữ liệu, có thể bạn sẽ cần thêm cột mới vào DataFrame của mình. Điều này có thể là một cột phụ thuộc tính dựa trên dữ liệu hiện có hoặc có thể là dữ liệu mới. Bất kể làm thế nào, bạn sẽ thường xuyên phải thêm hay gán dữ liệu vào DataFrame của mình. Trong bài viết này, chúng ta sẽ tìm hiểu về 5 cách thêm cột mới vào DataFrame trong thư viện Pandas.

2.1. Sử dụng phương thức gán cột (Assign a Column)

Phương thức đầu tiên mà bạn có thể sử dụng để thêm một cột mới vào DataFrame là đơn giản gán một cột mới cho DataFrame. Bạn chỉ cần truyền tên cột mới vào DataFrame và gán giá trị cho cột đó là một giá trị duy nhất hoặc một danh sách giá trị.

# Gán giá trị duy nhất cho cột mới
df['day'] = 'Monday'
# Gán danh sách giá trị cho cột mới
df['day'] = ['Monday', 'Tuesday', 'Wednesday', 'Thursday']

Cách này phù hợp khi bạn muốn thêm một cột có cùng giá trị cho tất cả các dòng trong DataFrame hoặc khi bạn đã có một danh sách giá trị sẵn có.

2.2. Sử dụng phương thức insert

Phương thức insert cho phép bạn chèn một cột mới vào vị trí xác định bằng cách chỉ định chỉ số của cột trong DataFrame. Với phương thức này, bạn cũng có thể gán giá trị duy nhất hoặc một danh sách giá trị cho cột mới.

# Chèn cột mới vào vị trí xác định trong DataFrame
df.insert(1, 'stars', [4, 5, 3, 4])

Ví dụ trên chèn cột mới có tên là 'stars' vào vị trí thứ 1 trong DataFrame. Điều này đồng nghĩa với việc cột mới được chèn vào sau cột đầu tiên của DataFrame.

2.3. Sử dụng phương thức df.insert

Phương thức df.insert tạo ra một cách dễ dàng để chèn một cột mới vào vị trí tùy ý trong DataFrame. Bạn chỉ cần chỉ định tên cột mới, vị trí để chèn và gán giá trị cho cột mới.

# Chèn cột mới tại vị trí xác định trong DataFrame
df.insert(loc=2, column='average_half_bill', value=df['average_bill']/2)

Ví dụ trên chèn cột mới có tên là 'average_half_bill' vào sau cột thứ 2 trong DataFrame. Giá trị của cột mới được tính bằng cách lấy giá trị của cột 'average_bill' chia cho 2.

2.4. Sử dụng phương thức loc

Phương thức loc thường được sử dụng để truy cập và thay đổi giá trị của các phần tử trong DataFrame. Tuy nhiên, bạn cũng có thể sử dụng phương thức loc để tạo một cột mới và gán giá trị cho cột đó.

# Tạo cột mới và gán giá trị cho cột đó
df.loc[:, 'months_visited'] = ['January', 'February', 'April', 'December']

Ví dụ trên tạo ra một cột mới có tên là 'months_visited' và gán giá trị cho cột đó bằng một danh sách các tháng.

2.5. Phương pháp không được khuyến nghị

Cuối cùng, có một cách không được khuyến nghị để thêm cột mới vào DataFrame là sử dụng phương thức loc để gán giá trị cho một cột hoàn toàn mới. Tuy phương pháp này có thể hoạt động, nhưng nó không phải là cách thông thường và không được khuyến nghị sử dụng.

# Gán giá trị cho một cột hoàn toàn mới sử dụng phương pháp không được khuyến nghị
df.loc[:, 'year'] = [2020, 2021, 2019, 2018]

Với phương pháp này, bạn sẽ gặp khó khăn trong việc gỡ lỗi và duy trì mã của mình. Do đó, nên sử dụng một trong các phương pháp trước đó đã được trình bày.

Những lưu ý khi thêm cột vào DataFrame

Khi thêm cột mới vào DataFrame, có một số điểm mà bạn cần lưu ý:

  • Đảm bảo số lượng giá trị trong cột mới phải khớp với số hàng trong DataFrame, trừ khi bạn chỉ định các giá trị mặc định cho các hàng không có giá trị.
  • Kiểm tra vị trí chèn của cột mới để đảm bảo vị trí là hợp lý và không làm thay đổi cấu trúc DataFrame.
  • Sử dụng các phương pháp khuyến nghị như assign, insert, df.insert hoặc loc để thêm cột mới vào DataFrame.

Kết luận

Trên đây là 5 cách thêm cột mới vào DataFrame trong thư viện Pandas. Mỗi cách có ưu điểm và hạn chế riêng, vì vậy hãy chọn phương pháp phù hợp với yêu cầu của bạn. Việc thêm cột mới vào DataFrame giúp bạn mở rộng khả năng xử lý dữ liệu và phân tích thêm thông tin mới.

Tài liệu tham khảo

Are you spending too much time on seo writing?

SEO Course
1M+
SEO Link Building
5M+
SEO Writing
800K+
WHY YOU SHOULD CHOOSE Proseoai

Proseoai has the world's largest selection of seo courses for you to learn. Each seo course has tons of seo writing for you to choose from, so you can choose Proseoai for your seo work!

Browse More Content