ฉันจะพาแรกของฉันขั้นตอนใน Azure Databricks
โลกและดังนั้นฉันต้องเรียนรู้วิธีใช้ SparkR
.
[ฉันมาจาก data.table
]
ถึงแม้ว่าฉันต้องอ่านหนังสือเยอะของเอกสารคู่มือ,ฉันคิดว่ามีบางอย่างหลบหนีออกไปฉัน SparkDataFrame.
เพื่อสร้างคอลัมน์แสดงผล view->ฉันเรียนรู้ว่าเราสามารถทำอะไรแบบ:
sdf$new <- sdf$old * 0.5
แต่ถ้าฉันต้องการเพื่อใช้เป็นพื้นฐานฟังก์ชัน,ฉันมีข้อผิดพลาดเกิดขึ้นระหว่างและฉันยังคิดไม่ออกเลยว่าทำไม:
sdf <- sql("select * from database.table")
sdf$new <- strsplit(sdf$old, "-")[1]
Error in strsplit((sdf$old), "-") :
non-character argument
Some(<code style = 'font-size:10p'> Error in strsplit((sdf$old), "-"): non-character argument </code>)
ฉันพลาดอะไรไป
ขอบคุณ
getItem
. SparkR ดูเหมือนใหม่ภาษาของฉัน!