java - Search address by name link - Jsoup -
how web address not title description of link (in case, "następna strona" it's means next page) html code? more draw internet address of link name between text
<a href="/w/index.php?title=kategoria:angielski_(indeks)&pagefrom=abstract+art#mw-pages" title="kategoria:angielski (indeks)">następna strona</a> package outerdictionary; import java.io.ioexception; import java.util.arraylist; import java.util.list; import org.jsoup.jsoup; import org.jsoup.nodes.document; import org.jsoup.nodes.element; import org.jsoup.select.elements; public class adresswww { public static void main(string[] args) { document doc; list<string> wikiwords = new arraylist<string>(); string addreswww="http://pl.wiktionary.org/w/index.php?title=kategoria:angielski_(indeks)&pagefrom=abducent#mw-pages"; try { doc = jsoup .connect(addreswww).get(); string title = doc.title(); system.out.println(title); //element indiv = doc.select("a[title=kategoria:angielski (indeks)]").first(); element indiv = doc.select("a[title=kategoria:angielski (indeks)]następna strona").first(); system.out.println(indiv); string row = indiv.attr("abs:href"); system.out.println("xxx "+row); // system.out.println(row.text());} } catch (ioexception e) { // todo auto-generated catch block e.printstacktrace(); } (string x : wikiwords) system.out.println(x); system.out.println(wikiwords.size()); }}
you can test text of each link:
document doc = jsoup.connect("http://pl.wiktionary.org/w/index.php?title=kategoria:angielski_(indeks)&pagefrom=abducent#mw-pages").get(); for( element element : doc.select("a") ) { if( element.text().equalsignorecase("następna strona") ) { system.out.println(element); } } or using selector syntax:
// ... for( element element : doc.select("a:contains(następna strona)") ) { system.out.println(element); } in both cases, result is:
<a href="/w/index.php?title=kategoria:angielski_(indeks)&pagefrom=abstract+art#mw-pages" title="kategoria:angielski (indeks)">następna strona</a> <a href="/w/index.php?title=kategoria:angielski_(indeks)&pagefrom=abstract+art#mw-pages" title="kategoria:angielski (indeks)">następna strona</a>
Comments
Post a Comment