Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailemVyřešeno Jak zjistit link na podřízené www stránky, na něž nevede link z hlavní strany?

Ahoj, můžete mi prosím poradit?
Na některých odborných serverech, kam často chodím, udělali jakousi reorganizaci webových stránek. Stalo se tak, že na předchozí a dosud existující webové stránky s cennými staršími informacemi nevede link z hlavní strany ani z dalších přístupných stránek. Můžete mi poradit nějaký příkaz či utilitku, jak bych zjistila strukturu přístupných informací na nějaké website?

Příklad - firemní web firmy ABC (odkazy jsou smyšlené):
Hlavní strana index.htm
dále jsou strany strana1.htmstrana9.htm
Tyto všechny stránky jsou provázány odkazy a dá se na ně normálně dostat "klikáním" :-)

Na serveru firmy jsou ale uložené i dřívejší verze stránek s důležitými informacemi dejme tomu info.htm a old.htm
Když vím adresy těchto "schovaných" stránek a zadám je do adresního řádku, tak se mi normálně zobrazí - nejsou tedy nijak skryté před veřejností. Jenže když nevím přesný link, tak na ně nenatrefím nebo jen náhodně.

Můžete mi prosím poradit, jak zjistit existenci a link pro ty "schované" stránky? Nějaká obdoba příkazu DIR ve starém dobrém MS DOSu nebo tak něco... Děkuju předem :-)

Předmět Autor Datum
A nemá dotyčný web nějakou "mapu webu"? Jinak zkus použít tento program: http://www.stahuj.cz/inter…
host 02.02.2007 11:18
host
A nemá dotyčný web nějakou "mapu webu"? Ono je těch webů víc, kde bych potřebovala hledat. Mapy web…
Eva_M 02.02.2007 11:41
Eva_M
Tak jsem si jej kvůli Tobě nainstaloval... ;-) Zadá se URL adresa, pak se klikne na Get. Dole vyber…
host 02.02.2007 11:56
host
Připadám si jako BFU, ale fakt mi to nejde. Podařilo se mi to u poradna.net , ale třeba u stránek ww…
Eva_M 02.02.2007 12:07
Eva_M
Stranka je delana pomoci ramu. Zkus to ze stranky: menu.htm
Jan Fiala 02.02.2007 12:13
Jan Fiala
Stranka je delana pomoci ramu. Zkus to ze stranky: menu.htm Vyhodilo mi to jen link loose.dtd Jakou…
Eva_M 02.02.2007 12:18
Eva_M
To bude tim, ze ten extractor neumi pracovat s relativnimi odkazy. Ja ten program neznam...
Jan Fiala 02.02.2007 12:26
Jan Fiala
Hm, odkazy v tom menu jsou zapsány relativně (bez http://), takže je asi ten LinkExtractor nedokáže…
host 02.02.2007 12:26
host
Takže tenhle prográmek mi stejně nepomůže. Neumí relativní odkazy, musela bych zkoumat, jak jsou děl…
Eva_M 02.02.2007 12:29
Eva_M
Podobný online nástroj, ale stále to není ono... http://www.webmaster-toolkit.com/link-extractor.sh…
host 02.02.2007 12:33
host
Jak se mi zdá, tak to ale všechno vyzobává odkazy vedoucí z hlavní stránky - což nepotřebuju, ty tam…
Eva_M 02.02.2007 15:44
Eva_M
Co kontaktovat webmastera těch stránek? Protože: 1. U složité struktury nemusí ani tušit, že někde v…
Rce 02.02.2007 12:37
Rce
myslím že je to opravdu tak :-( pokud byly stránky indexované googlem (což je dost pravděpodobné),…
viva 02.02.2007 13:47
viva
pokud byly stránky indexované googlem (což je dost pravděpodobné), možná by něco našel i z těch star…
Eva_M 02.02.2007 15:39
Eva_M
Co kontaktovat webmastera těch stránek? Protože: 1. U složité struktury nemusí ani tušit, že někde v…
Eva_M 02.02.2007 15:39
Eva_M
Možná by mohl pomoci sw jako Teleport Pro na stahování celých webů. Muselo by se v něm pečlivě vyfil…
L-Core 02.02.2007 11:32
L-Core
zda dovede strukturu webu jen naznačit (což by bylo ono) Ano, to je přesně to, co potřebuju - zobra…
Eva_M 02.02.2007 15:45
Eva_M
ještě lepší je Offline Explorer Enterprise, ten má přímo volbu "Explore all possible subdirectories"…
Jirka1 02.02.2007 16:14
Jirka1
ještě lepší je Offline Explorer Enterprise, ten má přímo volbu "Explore all possible subdirectories"…
Eva_M 02.02.2007 17:25
Eva_M
sice tomu nerozumím :-(, ale zkusil bych příkaz na google site:www.abc.cz , který vypíše všechny zai…
AZOR 02.02.2007 16:32
AZOR
zkusil bych příkaz na google site:www.abc.cz , který vypíše všechny zaindexované strany googlem z té…
Eva_M 02.02.2007 17:07
Eva_M
:-( Když já pivo nepiju... btw: kdyžtak si to ulož, buhví co s tim budou dělat...
AZOR 02.02.2007 17:56
AZOR
no moznosti je viac. jedna z nich je ta, co spominal AZOR pomocou google index, druha staci dat v FF…
IgorK 02.02.2007 21:04
IgorK
staci dat v FF prave tlacitko a zvolit page info a zvolit zalozku links Jenže tak se mi zobrazí je…
Eva_M 02.02.2007 21:23
Eva_M
Offline Explorer ti takisto podla mna neda stranky, ktore nie su nezname. pokial nie je povoleny v a…
IgorK 02.02.2007 21:41
IgorK
::) robots? Tam nic zajímavého nenajde.Většinou tam je, to co je pro vyhledávače nedostupné a nebo p…
AZOR 02.02.2007 21:29
AZOR
jasne ze robots.txt, vsak uz to dnes nikto nerobi cez meta a kde konci google s site:nieco.xyz, tam… poslední
IgorK 02.02.2007 21:42
IgorK

A nemá dotyčný web nějakou "mapu webu"?

Ono je těch webů víc, kde bych potřebovala hledat. Mapy webů nemají, to jsem hledala jako první.

Jinak zkus použít tento program: li nks-extractor/

Děkuju za tip, stáhla jsem si Links Extractor 1.2 , ale asi s ním neumím pracovat :-[
Domnívala jsem se, že když do pole Enter url zadám např. www.abc.cz , tak se mi vedle v poli links objeví cosi jako strana1.htmstrana9.htm a též info.htm a old.htm
Ale ono se tam neobjevuje vůbec nic. Ani odkazy na ty stránky, kam vedou linky a kam se dá dostat normálně klikání, a už vůbec ne ty hledané schované stránky :-( Co dělám špatně, prosím?

PS: Zkoušela jsem tam samozřejmě zadat existující website, který má nějaké podřízené stránky jako uvod.htm apod. A zkoušela jsem i ty stránky, u nichž vím, že existuje "schovaný", leč přístupný archív. Program mi bohužel nenašel vůbec nic.

Tak jsem si jej kvůli Tobě nainstaloval... ;-)

Zadá se URL adresa, pak se klikne na Get. Dole vybereš Full link. A pak tlačítko Search file. V pravém okně se objeví seznam všech odkazů, které vedou z té zadané stránky.

Což není ale asi to pravé ořechové, protože pokud je to tak, jak říkáš, že na ty schované stránky odkazy nevedou, tak je zřejmě tento program nenajde. :-/

Pak asi jedině nějaký offline stahovač/prohlížeč, jak radí L-Core. Třeba Offline Explorer nebo HTTTrack Website Copier.

Připadám si jako BFU, ale fakt mi to nejde. Podařilo se mi to u poradna.net , ale třeba u stránek www.ucto2000.cz mi to nenajde vůbec nic, i když to zkusím zadat jako www.ucto2000.cz Přitom když si najedeš na ty stránky, tak po straně vidíš menu s odkazy jako novinky.htm atd. Tak nevím :-/

Což není ale asi to pravé ořechové, protože pokud je to tak, jak říkáš, že na ty schované stránky odkazy nevedou, tak je zřejmě tento program nenajde.

Ano, potřebuju odkazy právě na ty schované stránky. Např. na výše uvedených stránkách jsou schované, leč přístupné history.htm

Jak se mi zdá, tak to ale všechno vyzobává odkazy vedoucí z hlavní stránky - což nepotřebuju, ty tam vidím. A navíc musím vědět, že je web v rámcích a podle toho zadat dotaz na tu hlavní stránku (např. menu ) což je nešikovné. Moje představa je, že do nástroje zadám, ať mi ukáže strukturu webu www.neco.cz a on mi ji ukáže bez ohledu na to, jestli je stránka v rámcích a jestli je vše provázáno linky nebo ne.

Uvedené nástroje mi nenajdou stránky, na něž nevede link - a o ně mi právě jde.
Jakým nástrojem mám najít třeba tu stránku history.htm , na níž nevede link ani z www.ucto2000.cz ani z menu.htm ? Nejde jen o tuto stránku, berte to prosím jen jako příklad, na němž ilustruju, o co mi jde.

Co kontaktovat webmastera těch stránek? Protože: 1. U složité struktury nemusí ani tušit, že někde vypadl odkaz na archív. 2. Chce to zrušit, vyházel odkazy a jen to tam tak nějak zbylo - pak je vhodné mu sdělit, že informace jsou pro lidi cenné.
Obávám se, že všechny Teleporty a pod. jen vyzobou odkazy. Tohle chce spíš nějaký hackerský nástroj na propátrání toho WEBu :-).

Co kontaktovat webmastera těch stránek? Protože: 1. U složité struktury nemusí ani tušit, že někde vypadl odkaz na archív. 2. Chce to zrušit, vyházel odkazy a jen to tam tak nějak zbylo - pak je vhodné mu sdělit, že informace jsou pro lidi cenné.

Ano, to jsem již udělala, ale zatím žádná odezva. (Tato poznámka se netýká výše uvedeného webu ucto2000, ale jiných, o které mám zájem).

Možná by mohl pomoci sw jako Teleport Pro na stahování celých webů. Muselo by se v něm pečlivě vyfiltrovat, co stahovat (*.htm*) a vzdálenost od hlavní stránky. Nevím ale, zda dovede strukturu webu jen naznačit (což by bylo ono), nebo rovnou stahuje obsah.

ještě lepší je Offline Explorer Enterprise, ten má přímo volbu "Explore all possible subdirectories". Ale je dost složitý na nastavení a není free. Ale má 30-ti denní verzi tuším. Nicméně pokud je na serveru zablokováno prohlížení adresářů, tak nepomůže nic.

ještě lepší je Offline Explorer Enterprise, ten má přímo volbu "Explore all possible subdirectories". Ale je dost složitý na nastavení a není free. Ale má 30-ti denní verzi tuším. Nicméně pokud je na serveru zablokováno prohlížení adresářů, tak nepomůže nic.

Tééda Jirko, mockrát děkuju za tip. Ten prográmek je složitý, to máš pravdu, ale šikovný - a dokonce mluví i česky :-) Musela jsem důkladně prozkoumat všechny volby, než jsem přišla na to, jak z něj dostat požadované informace. Určitě mi toho ještě hodně uteklo, ale i tak už vidím, že je to skutečně vynikající nástroj. Takže ještě jednou DÍKY!!! :beer::beer:

zkusil bych příkaz na google
site:www.abc.cz , který vypíše všechny zaindexované strany googlem z té stránky.

Azore, vidím, že to nejjednodušší řešení je nakonec nejlepší. Máš pravdu - google našel snad úplně všechno včetně těch "schovaných" stránek ;-) Jen jsem se musela prolistovat a pročíst celkem 44 obrazovkami výpisů a odkazů ::) Škoda jen, že google neumí zobrazit výsledky také v přehledné stromové struktuře. Tam by se vše hledalo lépe. Ale i tak díky - pokud se mi nepodaří najít lepší nástroj (který bych ovládala ;-) ) , budu používat tento dotaz na strejdu Gůůůgla ;-) Děkuju a posílám virtuální pivečko! :beer:

staci dat v FF prave tlacitko a zvolit page info a zvolit zalozku links

Jenže tak se mi zobrazí jen stránky, na něž VEDOU odkazy. A já jsem potřebovala najít stránky, na něž linky nevedou.

niekym viac a niekym menej pouzivana moznost je robots.txt alebo robots.txt

To ale na všech stránkách taky nefunguje, jak jsem vyzkoušela.

Takže zůstanu u toho softíku Offline Explorer Enterprise - fakt vynikající! Ještě jednou děkuju Jirkovi1 za odkaz. Jsem jen zvědavá, jak se bude chovat po 30 dnech - jestli bude jen upozorňovat, ale bude ho možno používat, nebo jestli nebude chodit vůbec :-| Ale 400 USD je fakt moc :.(
Pro zájemce uvádím link
http://www.metaproducts.com/mp/Offline_Explorer_Ent erprise.htm

Offline Explorer ti takisto podla mna neda stranky, ktore nie su nezname. pokial nie je povoleny v apache directory listing, tak neviem odkial by sa mohol o tych strankach dozvediet, pokial nebudu vlozene priamo v stranke. tak schvalne, ktoru stranku ti nasiel, ktoru nenajdes mnou popisanym sposobom? jedine co ti moze povedat, ake vsetky povolene linky existuju na abc.cz a roznych podadresaroch. tu uznavam, ze to ulahci pracu, aj ked sa to da manualne urobit aj tym mojim sposobom. :-)

Zpět do poradny Odpovědět na původní otázku Nahoru