ยังไงจะลบสายถ้าไม่มีจดหมายภาษาไพธอน

0

คำถาม

ฉันต้องการจะลบจากข้อความถ้าไม่มีอะไรจดหมายและส่งว่าจะบรรจุจดหมายหรือตัวเลข ฉันพยายามแก้ปัญหานี้ได้โดยการใช้ RegEx ในปลั๊กอินสำหรับไพธอน,แต่ไม่สามารถลบสาย ตัวอย่างเช่น

string='''हिरासत में ली गई महिला 36 वर्षीय नूर सजात कमरुज़्ज़मा थीं
          British High Commissioner Greets
          
          पत्ता आंबेडकर चौक, निमशीरगाव,
          निमिशरगाव, निरमशिरगाव, कोल्हापूर, NIMSHIRGAON, Nimshirgaon,
          Address: ambedkar chowk,
          महाराष्ट्र, 416101
          Nimshirgaon, Kolhapur, Maharashtra,
          416101
          1832
          1947'''

การส่งออกฉันต้องการ

output=  '''British High Commissioner Greets
           Address: ambedkar chowk,
           Nimshirgaon, Kolhapur, Maharashtra,
           416101
           1832
           1947'''

ได้โปรดช่วยฉันออกไป!!!

data-structures pandas python python-3.x
2021-11-22 11:32:47
2

คำตอบที่ดีที่สุด

2

คุณสามารถใช้เรียบง่ายรู้จักเลนกับ regex ต้องตรงกับเพียงบรรทัดกับ ascii ตัวอักษร:

import re
out = '\n'.join(s for s in string.split('\n') if re.match(r'^[\x00-\x7F]+$', s))
print(out)

แสดงผล:

          British High Commissioner Greets
          
          Address: ambedkar chowk,
          Nimshirgaon, Kolhapur, Maharashtra,
          416101
          1832
          1947
2021-11-22 11:53:46
1

นี่คุณไป. แล้วแต่ตามเส้นมันไม่ทำตามรูปแบบ(คุณสามารถเพิ่มตัวอักษรในรูปแบบขึ้นอยู่กับสิ่งที่คุณต้องการ)มันจะไม่เป็น appended to ในส่วนส่งออก

ฉันคิดว่านี่จะแก้ปัญหาของคุณ

import re

pattern = re.compile("[a-zA-Z0-9!@#$&()\\-`.+,/\"]+")

multilinestring = '''हिरासत में ली गई महिला 36 वर्षीय नूर सजात कमरुज़्ज़मा थीं
British High Commissioner Greets        
पत्ता आंबेडकर चौक, निमशीरगाव,
निमिशरगाव, निरमशिरगाव, कोल्हापूर, NIMSHIRGAON, Nimshirgaon,
Address: ambedkar chowk,
महाराष्ट्र, 416101
Nimshirgaon, Kolhapur, Maharashtra,
416101
1832
1947'''

split_list = multilinestring.splitlines()
output_list = []
for word in split_list:
    if pattern.match(word):
        output_list.append(word)

print(*output_list, sep = "\n")

เมื่อสายรอยนิ้วมือกันและข้อความในรายชื่ออยู่แยกบนเส้น. นี่คือตัวเลือกการไล่ระดับสี

British High Commissioner Greets        
Address: ambedkar chowk,
Nimshirgaon, Kolhapur, Maharashtra,
416101
1832
1947
2021-11-22 12:00:15

ในภาษาอื่นๆ

หน้านี้อยู่ในภาษาอื่นๆ

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

ดังอยู่ในนี้หมวดหมู่

ดังคำถามอยู่ในนี้หมวดหมู่