Krom İçin Sıyırıcı Uzantısında Semalt Kılavuzu

Herhangi bir işletmenin hayatta kalabilmesi ve nihayetinde büyümesi için, rakiplerinin ve çeşitli risklerin önünde kalmak gerekir. Analitik verilere dayanarak karar vermek bu sorunları unutmanın kesin bir yoludur. Bu tür veriler, veri hurdaya çıkarma yoluyla elde edilebilir. Chrome için kolay kazıyıcı uzantısı burada devreye giriyor: sadece veri toplama işlemini kolaylaştırmakla kalmayacak, aynı zamanda karmaşık kurulumlar olmadan hareket halindeyken kazımayı mümkün kılacak.

Sıyırıcı nasıl kullanılır

    1. Yapmanız gereken ilk şey, uzantıyı yüklemektir, bu nedenle chrome web mağazasına gidin, "kazıyıcı" yı arayın ve Chrome'a ekle'yi tıklayın.

    2. Verileri kazımak istediğiniz web sitesine gidin, ilgilendiğiniz girişi vurgulayarak işaretleyin. Üzerine sağ tıklayın ve açılan menüden "benzer kazıma" yı seçin.

    3. Bunu yaptığınızda ayrı bir sıyırıcı konsol penceresi açılacaktır. Burada, kazınmış verilerin bir listesini göreceksiniz.

    4. İçeriği kaydetmek için "Google dokümanlarına kaydet" i tıklayın. Bu, verileri otomatik olarak bir Google e-tablosuna aktarır.

Genişletilmiş kazıma

Daha fazla veri kazımayı planlıyorsanız, gelişmiş yaklaşımı kullanabilirsiniz. HTML konusunda bilginiz varsa, araçla çalışmak çok daha kolay olacaktır. Zaman serisi verilerine dayalı bir arşivi olan bir kaynaktan veri kazımak istediğinizi varsayalım. Bu durumda, yukarıda açıklanan yöntemi denerseniz, bozuk verileri alırsınız.

Bu sorunu çözmek için XPath olarak bilinen bir HTML ve XML sorgu dilini kullanabilirsiniz. Bu ne işe yarıyor? XPath, her seçimde bulunan farklı öğelerle ilgili verileri tanır. Aşağıda, bunun nasıl yapılacağı ile ilgili bir kılavuz yer almaktadır:

1. Sıyırıcı konsoluna gidin, sol üst köşede bir "XPath" düğmesi görmelisiniz, üzerine tıklayın ve ilk tabloyu monte etmeye devam edin.

2. Doğru eleman için XPath yazmanız gerekir. Tüm bilgileri içeren geçerli XPath, "// div [3] / div [3] / div [2] / div" gibi bir biçimde görüntülenir. <div> öğeleri bilgisayar tarafından HTML belgesinde tanınır.

3. Tanınan verileri ayırmak için Sıyırıcı sütunlarını kullanmanız gerekir. Bunu yapmak için elinizde bulunan farklı bilgi türlerini aramanız gerekir. Kazıdığınız verilere bağlı olarak başlıklarınız olabilir. Bu başlıklar her veri kümesinin yanında bulunur. Bunlara bir etiket, bu durumda bir <b> etiketi eşlik eder.

4. Inspect öğesini kullanarak <b> etiketini bulun ve XPath'inize ekleyin. Artık bu ilk sütunu, başlıkları listeleyeceği için "başlık sütunu" olarak etiketleyebilirsiniz. İhtiyacınız olan her sütun için farklı XPath'ler oluşturmaya devam edin.

5. Kazımayı tıklayın, uzantı verileri otomatik olarak toplar ve belirlediğiniz farklı sütunlar halinde düzenler.