|
Universiteti telekommunikatsiya texnologiyalari fakulteti
|
bet | 3/5 | Sana | 18.12.2023 | Hajmi | 0,51 Mb. | | #122899 |
Bog'liq 1701245019 (1)Misol
Natijani ko'ring.
1.2 Jsoup - Loading from URL.
Quyidagi misolda url yordamida internetdan HTMLni olish va keyin uning maʼlumotlarini topish koʻrsatiladi.
Syntax
String url = "http://www.google.com";
Document document = Jsoup.connect(url).get();
document − document ob'ekti HTML DOM ni ifodalaydi.
Jsoup − urlni ulash va HTML String ni olish uchun asosiy class.
url - yuklanadigan html sahifasining url.
Description
Connect(url) usuli url bilan bog'lanadi va get() usuli so'ralgan urlning html-ni qaytaradi.
Misol
Natijani ko'ring.
Ma'lumotlarni ajratib olish
2.1 Jsoup - Using DOM Methods
Quyidagi misolda HTML satrini document ob'ektiga ajratgandan so'ng DOM kabi usullardan foydalanish ko'rsatiladi.
Syntax
Document document = Jsoup.parse(html);
Element sampleDiv = document.getElementById("sampleDiv");
Elements links = sampleDiv.getElementsByTag("a");
document − document ob'ekti HTML DOM ni ifodalaydi.
Jsoup − berilgan HTML String ni tahlil qilish uchun asosiy class.
html − HTML String.
sampleDiv - Element ob'ekti "sampleDiv" identifikatori bilan aniqlangan HTML tugun elementini ifodalaydi.
links- Elementlar obyekti "a" tegi bilan aniqlangan bir nechta tugun elementlarini ifodalaydi.
Misol
Natijani ko'ring.
DOM va jsoup asoslari
DOM-bu hujjatning tuzilishi va uslubini belgilaydigan HTML hujjatlarining tildan mustaqil vakili. 1-rasmda jsoup ramka sinflarining sinf diagrammasi ko'rsatilgan. Keyinchalik, men sizga dom elementlariga qanday xaritalarini ko'rsataman.
org.jsoup.nodes.Node abstract class jsoupning asosiy elementidir. U dom daraxtidagi tugunni ifodalaydi, u hujjatning o'zi, matn tuguni, sharh yoki hujjat ichidagi element, ya'ni shakl elementlari bo'lishi mumkin. Node class ota-ona tuguniga ishora qiladi va ota-onaning barcha tugunlarini biladi. Element class Teg nomi, atributlari va bolalar tugunlaridan iborat HTML elementini ifodalaydi. Attributlar classi HTML elementlarining atributlari uchun konteyner bo'lib, uning ichida tuzilgan Node class.
|
| |