Semalt៖ កម្មវិធីកាត់អត្ថបទចំនួន ៥ អស្ចារ្យសម្រាប់អ្នកកាសែត

អ្នកសារព័ត៌មានប្រមូលប្រមូលនិងចែកចាយខ្លឹមសារជាប្រចាំ។ គាត់ផ្តោតសំខាន់លើបញ្ហាទូទៅបញ្ហានយោបាយឬគ្រោះមហន្តរាយធម្មជាតិ។ អ្នកសារព័ត៌មានភាគច្រើនយកព័ត៌មាននៅក្នុងពិភពកំសាន្តខណៈដែលអ្នកផ្សេងទៀតនិយាយអំពីល្បែងនិងកីឡា។ អ្នកសារព័ត៌មានត្រូវបំពេញភារកិច្ចអេតចាយអត្ថបទជាច្រើនក្នុងពេលតែមួយ។ គាត់មិនត្រឹមតែដកស្រង់ទិន្នន័យប៉ុណ្ណោះទេថែមទាំងធានានូវភាពត្រឹមត្រូវនិងភាពស្របច្បាប់របស់វាដល់កំរិតមួយផងដែរ។ ជួនកាលអ្នកសារព័ត៌មានបញ្ចោញខ្លួនឱ្រយមានគ្រោះថ្នាក់ហើយសរស្ររអត្ថបទព័ត៌មានដើម្របីទាក់ទងអ្នកអានកាន់ត្រច្រើន។ ប្រសិនបើអ្នកចង់ក្លាយជាអ្នកសារព័ត៌មាននិងខ្វះជំនាញសរសេរកម្មវិធីអ្នកអាចប្រើពាក្យសុំខាងក្រោមដើម្បីបំពេញការងាររបស់អ្នក។

Scraper៖

ស្កេបភឺរគឺជាផ្នែកមួយនៃសេវាកម្មកាត់អត្ថបទនិងរូបភាពដែលល្អបំផុតនិងមានប្រយោជន៍បំផុត។ វាងាយស្រួលប្រើនិងភ្ជាប់មកជាមួយចំណុចប្រទាក់ងាយស្រួលប្រើ។ ជាមួយ Scraper អ្នកសារព័ត៌មានអាចកំណត់គោលដៅលើគេហទំព័រជាច្រើនក្នុងពេលតែមួយនិងដកស្រង់ទិន្នន័យពីគេហទំព័រទាំងមូលឬផ្នែកខ្លះ។ Scraper ត្រូវបានគេស្គាល់ថាល្អបំផុតសម្រាប់បច្ចេកវិទ្យារៀនម៉ាស៊ីនរបស់វាហើយដកស្រង់អត្ថបទសាមញ្ញពីស៊ីអិនអិនប៊ីប៊ីស៊ីនិងគេហទំព័រព័ត៌មានស្រដៀងគ្នាផ្សេងទៀត។ បន្ទាប់មកអ្នកអាចនាំចេញទិន្នន័យនេះទៅឯកសារ Google Docs, CSV ឬ JSON ។ វាប្រើ XPath ដើម្បីវាយតម្លៃគុណភាពអត្ថបទ។

2. បណ្តាញ Outwit:

Outwit Hub គឺសមរម្យសម្រាប់ទាំងអ្នកកាសែតនិងអ្នកសរសេរព័ត៌មានដែលមិនមែនជាអ្នកសរសេរកម្មវិធី។ អ្នកមិនចាំបាច់រៀន Python, C ++ ឬ Ruby ដើម្បីទទួលបានអត្ថប្រយោជន៍ពីពាក្យសុំនេះទេ។ ភាគច្រើនវាជាផ្នែកបន្ថែមរបស់ Firefox និងអេតចាយឯកសារអត្ថបទឯកសារ PDF ឯកសារ HTML និងរូបភាពសម្រាប់អ្នក។ Outwit Hub ផ្តល់នូវលទ្ធផលត្រឹមត្រូវហើយអាចត្រូវបានប្រើដើម្បីបង្កើតគេហទំព័រផ្សេងៗគ្នាយ៉ាងងាយស្រួល។

Scraperwiki៖

អ្នកអាចប្រើ Scraperwiki ដើម្បីដកស្រង់ទិន្នន័យពីទំព័រវិគីភីឌាទិនានុប្បវត្តិតាមអ៊ិនធឺរណែតគេហទំព័រព័ត៌មាននិងគេហទំព័រពាណិជ្ជកម្មអេឡិចត្រូនិច។ វាគឺជាកម្មវិធីផ្អែកលើកម្មវិធីរុករកដែលផ្តល់លទ្ធផលដោយមិនមានកំហុសភ្លាមៗ។ ប្រសិនបើអ្នកមិនមានចំណេះដឹងក្នុងការសរសេរកូដ Scraperwiki គឺជាជម្រើសត្រឹមត្រូវសម្រាប់អ្នក។ ជាមួយនឹងសេវាកម្មនេះអ្នកសារព័ត៌មានអាចកោសវែបសាយត៍ទាំងមូលនិងទាញយកទិន្នន័យទៅក្នុងដ្រាយរឹងរបស់ពួកគេក្នុងរយៈពេលតែប៉ុន្មានវិនាទីប៉ុណ្ណោះ។ កំណែបុរាណនៃ Scraperwiki គឺសមស្របសម្រាប់អ្នកអភិវឌ្ឍន៍កម្មវិធីឯករាជ្យនិងអ្នកគ្រប់គ្រងគេហទំព័រ។

៤. Import.io៖

អ៊ីមអ៊ីអូគឺជាសេវាកម្មស្កែនអត្ថបទដ៏ល្អនិងមានប្រយោជន៍បំផុតមួយនៅលើអ៊ីនធឺណិត។ វាជួយអ្នកសារព័ត៌មានស្វែងរកប្រធានបទដែលមាននិន្នាការទាញយកទិន្នន័យបានត្រឹមត្រូវនិងផ្សព្វផ្សាយវានៅលើគេហទំព័រព័ត៌មានផ្ទាល់ខ្លួនក្នុងរយៈពេលប៉ុន្មាននាទី។ ជាមួយ Import.io អ្នកអាចកោសទាំងអត្ថបទនិងឯកសារ JPG ។ នៅពេលដំឡើងនិងធ្វើឱ្យសកម្មឧបករណ៍នេះនឹងអនុវត្តរហូតដល់ពីរពាន់គម្រោងក្នុងការបញ្ឈប់អត្ថបទក្នុងពេលតែមួយ។ វាពិតជាការងារល្អក្នុងការប្រមូលយកមាតិកាពី URL ដែលបានផ្តល់ហើយអនុញ្ញាតឱ្យអ្នកញែកទិន្នន័យដោយគ្មានបញ្ហា។

មន្ទីរពិសោធន៍គីម៉ូណូ៖

ដូចគ្នានឹង Import.io ដែរគីមួនណូ Labs ផ្តោតលើគេហទំព័រមួយចំនួនធំ។ វាដើរតួជាអ្នកកាត់អត្ថបទពេញលេញនិងជាអ្នកទាញតាមអ៊ីនធឺណិតនៅលើអ៊ីនធឺណិត។ អ្នកគ្រាន់តែនិយាយអំពី URL ដែលអ្នកចង់ស្រង់ព័ត៌មានចេញពីហើយគីម៉ូណូ Labs នឹងទទួលបានលទ្ធផលដែលចង់បានក្នុងរយៈពេលពីរបីនាទី។ វាត្រូវបានគេស្គាល់ថាល្អបំផុតសម្រាប់បច្ចេកវិទ្យានៃការរៀនម៉ាស៊ីនហើយជីកជុំវិញអ៊ីនធឺណិតដើម្បីរកប្រធានបទដែលសមរម្យសម្រាប់អ្នកសារព័ត៌មាន។ អ្នកអាចរក្សាទុករូបភាពនិងឯកសារអត្ថបទទៅ Google ឯកសារឬទាញយកវាដោយផ្ទាល់ទៅកុំព្យូទ័ររបស់អ្នក។

mass gmail