[profi] toplevel domain auswerten
-
hallo!
ich habe ein php script, das mir in eine log datei z.B. folgende werte schreibt:
24.12.01 /home/ ix252.t-online.de.
24.12.01 /home/ blahbal.ax.aux.log.info.
24.12.01 /home/ blahbalh.de.us.da.com.info.eu.org.wie kann ich jetzt auswerten (per shellscript), wie oft z.b. jemand von einer bestimmten topleveldomain zugegriffen hat?
danke
-
moin nochmal..
du solltest dich mal über die textutils schlau machen..
cat <logfile> | grep "domain.de" | wc -l
-
Hallo!
das problem an der sache ist, das es alles verschieden domainnamen sind und ich nicht alle per grep hinschreiben will.
es müsste rein theoretisch nur mit cut gehen.
mein problem an der sache ist, das die domain namen unterschiedlich lang sind (z.B. t-online.de, gede.com.org.info.help.at) und ich nicht aufs letzte element kommen. sonnst würde es ja einfach mit cut -d '.' -f 3 gehen.
-
Wenn Du cut nicht auf Punkte sondern auf Leerzeichen ansetzten würdest, dann sollte es gehen (cut -d ' ' -f 4 < file)
Allerdings gibt's da noch andere Möglichkeiten, z.B. awk oder evtl. die eingebauten Fähigkeiten deiner Shell.
-
hm.. da bekomm ich ja die ganze domain, brauche aber nur die topleveldomain (.de, .com, .at, .edu etc)
-
moin
Wieso verschiedene domains? du wolltest doch gerade noch die Zufgriffe von
einer _bestimmten_ domain zählen??Auf welches "letzte Element" willst du zugreifen?
Willst du nun zählen wie oft von *.de etc. zugegriffen wurde??cat log | cut -d' ' -f 3 | sed 's/\.$/ /' | grep ".de " | wc -l
alle Zugriffe von *.decat log | cut -d' ' -f 3 | sed 's/\.$/ /' | grep ".de \|.org " | wc -l
alle Zugriffe von *.de und *.org
-
Oder
cut -d ' ' -f 3 log | grep '\.de$' | wc -l
-
da fehlt ein punkt
-
ups ich meine verschiede domains.
ich hab mich wohl etwas falsch ausgedrückt, sorry
hier ein auszug der hostnames aus der log:sutvs003.zaq.ne.jp.
111.228.186.195.dial.bluewin.ch.
dclient217-162-1-78.hispeed.ch.
user66.net183.nc.sprint-hsd.net.
posta.unicontrols.cz.
sutvs003.zaq.ne.jp.
sutvs003.zaq.ne.jp.
goliash.tesnetwork.cz.
p50838DFC.dip.t-dialin.net.
Kitchener-HSE-ppp3573074.sympatico.ca.
sutvs003.zaq.ne.jp.
pD9EAA745.dip.t-dialin.net.
pD9EAA745.dip.t-dialin.net.
dup-200-65-127-162.prodigy.net.mx.jetzt will ich von jeder toplevel domain eine statistik
hier z.B.
Domain Anzahl
mx 1
net 4
jp 4
ca 1
cz 2
ch 2
etc. und das für alle toplevel domains die in der log vorkommen.
ich hoffe, jetzt habe ich mich verständlicher ausgedrückt
gruß
michi