Semalt. Վեբ տվյալների արդյունահանում Google Chrome Plugin- ով

Եթե դուք օգտագործում եք Google Chrome Browser ցանցը ցանց որոնելու համար, ձեր նախընտրած ինտերնետային էջերից տվյալներ հանելու համար կա զննարկչի հավելված: Google Chrome Scraper- ը ծրագրակազմ է, որն օգտագործվում է ինչպես դինամիկ, այնպես էլ ստատիկ կայքերից տվյալների ստացման համար: Chrome- ի այս plugin- ը թույլ կտա ձեզ ջնջել ձեր նախընտրած վեբ էջի պարունակությունը և պահպանել այն Google Փաստաթղթերում:

Google Chrome Վեբ քերիչ

Google Chrome Web Scraper- ը զննարկիչի ընդլայնում է, որը տվյալներ է հանում կայքերից և էջերից: Այս ընդլայնմամբ ձեզ հարկավոր չեն հարյուրավոր աշխատողներ `ամբողջ օրը կայքերից պատճենելու համար բովանդակությունը պատճենելու համար: Ձեր Chrome զննարկիչում տեղադրվելուց հետո ձեզնից միայն այն է, որ ընտրեք թիրախային բովանդակությունը և թույլ տվեք, որ վեբ քերիչը կատարի մնացածը:

Եթե դուք չունեք կոդավորման գիտելիքներ, սա լավագույն վեբ քերիչն է, որը պետք է դիտարկել: Google Chrome Scraper- ը առաջարկվում է ինչպես փոքր, այնպես էլ մեծ մասշտաբի ջարդոններով: Այն պարունակում է արժեքավոր տեղեկատվություն և տվյալներ, որոնք կարող են վերածվել մրցակցային հետախուզական տվյալների: Այս ընդլայնման միջոցով ձեր բոլոր թիրախային նկարներն ու տեղեկագրերը հեշտությամբ կարող են արդյունահանվել և արտահանվել CouchDB- ի կամ աղյուսակների:

Ուղեցույցներ, թե ինչպես սկսել

Վեբ էջերը զննարկչի հավելվածով գրելը դա ինքնուրույն խնդիր է, որը դուք կարող եք արագ կատարել ձեր համակարգչի հետ: Ահա վերջնական ուղեցույց, որը կօգնի ձեզ սկսել.

  • Սկսեք ձեր Google Chrome զննարկիչը և կտտացրեք «Chrome Web Store»:
  • Բացեք ձեր զննարկչի ընդարձակումները և որոնեք «Scraper»:
  • Կտտացրեք ձեր էկրանին ցուցադրվող «Ավելացնել Chrome» տարբերակին
  • Բացեք կայքը կամ վեբ էջը, որը պետք է ջարդվի, և կարևորեք ձեռք բերված տվյալները: Աջ սեղմեք տարրի վրա և կտտացրեք «Գրությունը նման»:
  • Ձեր էկրանին կհայտնվի քերիչ վահանակ: Նկատի ունեցեք, որ վեբ քերիչների վահանակը բաղկացած է արդյունահանված տվյալներից:
  • Այս փուլում դուք կարող եք որոշել, թե որտեղ պետք է պահպանեք ձեր քերած բովանդակությունը: Օրինակ, բովանդակությունը կարող եք պահել Google Docs- ում `կտտացնելով« Պահել Google Փաստաթղթերին »:

Նկատի ունեցեք, որ «քերիչ» -ը ավտոմատ գրություն է, որը օգտակար տվյալներ է քաղում դինամիկ կայքէջերից և կայքերից: Ի տարբերություն վեբ գրությունների այլ գործիքների ՝ Google քրոմը կարող է ջարդել նաև JavaScript- ով ստացված տվյալները : Chrome scraper plugin- ի կողմից կատարված այլ առաջադրանքներ են.

  • Տվյալները բեռնելու համար սեղմելով բովանդակության կոճակները;
  • Կտտացնելով էջագրման կոճակները, որոնք բեռնում են տեղեկատվությունը ՝ օգտագործելով AJAX;
  • Ոլորելով վեբ էջերը `ավելի շատ բովանդակություն բեռնելու համար;
  • Սպասում է, որ դինամիկ բովանդակությունը բեռնվի ինտերնետային էջում.

Համացանցային էջից տվյալները ջարդելուց հետո դուք կարող եք ներբեռնել տվյալները ստորակետերով առանձնացված արժեքներով (CSV) ձևաչափով կամ պահել այն CouchDB- ում: Google Chrome Web Scraper- ի միջոցով հարկ չկա աշխատել տվյալների արդյունահանման, պլանավորման կառուցման կամ արտահանման վրա: