กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

ข่าว ไมโครซอฟท์ออก MarkItDown ไลบรารีสำหรับแปลงไฟล์ Office เป็น Markdown

News 

Moderator
สมาชิกทีมงาน
Moderator
Verify member
เข้าร่วม
1 มิถุนายน 2011
ข้อความ
10,270
คะแนนปฏิกิริยา
0
คะแนน
0
ไมโครซอฟท์ออก MarkItDown ไลบรารีภาษาไพธอนสำหรับแปลงเอกสารในชุด Microsoft Office (.docx, .xlsx, .pttx) รวมถึงไฟล์ PDF, HTML ให้อยู่ในฟอร์แมต Markdown

เนื่องจาก MarkItDown ออกแบบมาเป็นไลบรารี วิธีการใช้งานจึงต้องเรียกผ่านการเขียนโค้ด Python สั้นๆ ตามตัวอย่าง

from markitdown import MarkItDown

markitdown = MarkItDown()
result = markitdown.convert("test.xlsx")
print(result.text_content)

เป้าหมายของ MarkItDown คือแปลงไฟล์เอกสารประเภทต่างๆ มาเป็น Markdown ฟอร์แมตเดียว เพื่อให้สะดวกกับการนำไปประมวลผลต่อในงานอื่นๆ เช่น วิเคราะห์ข้อมูลประเภทข้อความ ตัวไลบรารีเป็นโอเพนซอร์ส ใช้สัญญาอนุญาตแบบ MIT

ที่มา - Microsoft GitHub

ไมโครซอฟท์ออก MarkItDown ไลบรารีสำหรับแปลงไฟล์ Office เป็น Markdown-1.png


Topics:
Microsoft Office
Microsoft
Open Source

Continue reading...
 

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม