ยังไงจะลบ 50%ของแถวนั้นแบ่งค่าคอลัมน์

0

คำถาม

df.groupby(['target']).count()
เป้าหมาย ข้อมูล
ไม่ 103210
ค่าเป็นบวก 211082

ตอนนี้ฉันมั่นใจข้อมูลใหญ่เกินไป ฉันต้องการจะลบ 50%ของแถวของใครค่า Target คอลัมน์คือ Positive. ฉันต้องทำยังมัน?

dataframe drop pandas python
2021-11-24 03:30:28
1

คำตอบที่ดีที่สุด

6

เพื่อให้ครึ่งหนึ่ง Positive แถว, sample 50%ของคน Positive ใช้แถว frac=0.5 แล้ว drop พวกนั้น indexes:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

เพื่อให้แน่ 100K Positive แถว, sample 100K Positive ใช้แถว n=100_000 แล้ว concat พวกเขาพร้อมกับ Negative จำนวนแถว:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])
2021-11-24 04:27:20

ในภาษาอื่นๆ

หน้านี้อยู่ในภาษาอื่นๆ

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

ดังอยู่ในนี้หมวดหมู่

ดังคำถามอยู่ในนี้หมวดหมู่