Mwongozo wa Semalt Kwenye Ugani wa Scraper kwa Chrome

Kwa biashara yoyote kuishi na hatimaye kukua, inahitajika kukaa mbele ya washindani wake na hatari kadhaa. Kufanya maamuzi kwa msingi wa data ya uchambuzi ni njia ya uhakika ya kusahau kuhusu shida hizi. Takwimu kama hizo zinaweza kupatikana kupitia upelezaji wa data. Hiyo ndio mahali upanuzi rahisi wa Chrome unapoingia: haitafanya tu mchakato wa uvunaji wa data lakini pia itafanya uwezekano wa kupata mwambaa bila kusanidi ngumu.

Jinsi ya kutumia Scraper

    1. Jambo la kwanza unahitaji kufanya ni kusanidi kiendelezi, kwa hivyo elekea kwenye duka la wavuti ya chrome, tafuta "chakavu" na ubonyeze kuongeza kwenye Chrome.

    2. Nenda kwa wavuti ambayo unakusudia kuchota data kutoka, weka kiingilio ambacho unavutiwa na kukionyesha. Bonyeza kulia juu yake na uchague "chakavu sawa" kwenye menyu ambayo inatoka.

    3. Kufanya hivyo itazindua wigo tofauti wa koni. Hapa, utaona orodha ya data zilizokusanywa .

    4. Ili kuhifadhi yaliyomo, bonyeza "kuokoa kwa hati za Google," hii itahamisha data kiatomati kwa lahajedwali ya Google.

Kuongeza chakavu

Ikiwa utapanga kupanga data zaidi, unaweza kutumia mbinu ya hali ya juu. Kumbuka, itakuwa rahisi kufanya kazi na chombo ikiwa una ufahamu fulani wa HTML. Tuseme unataka kutaka data kutoka kwa chanzo ambacho kikiwa na kumbukumbu iliyo msingi wa data ya safu ya muda. Katika hali kama hiyo, ukijaribu njia iliyoelezewa hapo juu, utapata data iliyokatwa.

Ili kutatua suala hili, unaweza kutumia lugha ya maswali ya HTML na XML inayojulikana kama XPath. Inafanya nini? XPath inatambua data kuhusu vitu tofauti vilivyomo katika kila uteuzi. Ifuatayo ni mwongozo wa jinsi ya kufanya hivyo:

1. Nenda kwenye kiweko cha Scraper, upande wa kushoto kushoto unapaswa kuona kitufe cha "XPath", bonyeza juu yake na uendelee kukusanyika meza ya awali.

2. Unahitaji kuandika XPath ya kipengee sahihi. XPath ya sasa ambayo inajumuisha habari nzima itaonyeshwa kwa muundo kama huu "// div [3] / div [3] / div [2] / div". Vitu vya <div> vitatambuliwa katika hati ya HTML na kompyuta.

3. Ili kutenganisha data inayotambuliwa, lazima utumie safu wizi za Scraper. Kwa kufanya hivyo, unahitaji kutafuta aina tofauti za habari ambazo umepata. Kulingana na data unayopiga unaweza kuwa na majina. Hizi majina zipo karibu na kila seti ya data. Wanaongozana na tepe, katika kesi hii, tepe <b>.

Kutumia kukagua kipengee cha Machapisho na kuongeza kitambulisho cha <b> XPath yako. Sasa unaweza kuweka safu hii safu ya kwanza kama "safu ya kichwa" kwani itaorodhesha vyeo. Endelea kuunda XPaths tofauti kwa kila safu unayohitaji.

5. Bonyeza kwenye chakavu na kiendelezi kitavuna data moja kwa moja na kuzipanga katika safu tofauti uliyoweka.