Potřebuju následující: Mám internetovou diskuzi kde každý uživatel píše pod svým jménem nějaké příspěvky, a já potřebuju vytáhnout jména všech uživatelů, v jejichž příspěvcích se objeví určitá sekvence znaků (v jednotlivých slovech), napříkad „http“ a následně odfiltrovat jména uživatelů která jsou duplicitní.
Dokázal by někdo vytvořit takovej program? A pokud jo, jak moc je to složitý a jak dlouho by to trvalo?
Zajímavá 3Pro koho je otázka zajímavá? johana 56, briketka10, anonym před 4313 dny |
Sledovat
Nahlásit
|
No, jelikož nevíme o tvých stránkách z technického hlediska prakticky nic, tak těžko radit. Nevíme, jestli si děláš stránky sám, v čem, jak, nebo jestli využíváš služby nějaké další strany. Taky těžko říct, jak myslíš „odfiltrovat jména uživatelů, která jsou duplicitní“, ale obvykle se věci podobného charakteru řeší PHP skriptem, java skriptem, popř. dalšími nástroji jako AJAX, různé frameworky apod.
0 Nominace Nahlásit |
Zadarmo ti nikdo psát nebude!, ale poradím ti:
Pomocí PHP a MySQL (hádám že to jede na PHPBB) si načti všechny příspěvky do (nejlépe) pole následně si vytvoř regulérní výraz na to co potřebuješ (v tvém případě http) a pak porovnávej a do dalšího pole si např. ulož jméno uživatele a počet duplicit a pak podle podmínky si to pole vypiš.
0 Nominace Nahlásit |
Předpokládám, že myslíš z pohledu uživatele, nikoliv tvůrce stránky (to by bylo o dost jednodušší).
Celej problém bych rozdělil na dva kroky:
0 Nominace Nahlásit |
Tak jsem si dal du práci a napsal jsem takovej program. Má to jen takovej
drobnej háček – je to dost uživatelsky nepřívětivý (tj. musíš
vymyslet regulární výraz, kterej ti ze stažených stránek vyzobe jména).
Trochu jsem si s tím hrál a vytáhnul jsem pár uživatelských jmen zde
z Odpovědí – http://pastebin.com/n66wT1tT (uměl by samozřejmě
i vyfiltrovat jména, která splňují určitá kritéria)
Jestli chceš, můžu ti ho někam nahrát, ale bez základní znalosti
regulárních výrazů se prostě neobejdeš. A hodí se i trochu vědět, co
to je HTML.
Co to je reg. výraz.: http://www.regularnivyrazy.info/regularni-vyrazy-zaklady.html
Jenom pro informaci, v žádným programovacím jazyku sem nikdy nedělal, takže na mě nevytahujte ty svý odborný zkraky jako PHP, MIT, BFLMPSVZ a podobně, není vám to nic platný :)
Já už jsem kdysi dávno něco podobnýho potřeboval, ale řešil sem to tenkrát tak, že sem zmáčknul v prohlížeči CTRL+F, tak sem si zadal sekvenci, a když mi to našlo shodu, tak sem najel na začátek odstavce a jméno přispěvatele si zkopíroval do excelu. Když jsem měl hotovo, tak sem dal akorát „seřadit sestupně“ a duplicity sem viděl hned, protože byly hned pod sebou a nemusel jsem prohledávat každý jméno zvlášť v celým sloupci, jenže většinou to byla záležitost několika minut. Teď jde o o tisíce stran textu a tímhle způsobem se to řešit nedá, tak hledám nějakou automatiku.
l564:
Jestliže by byl provozovatel on, nebylo by jednodušší sestavit správný sql
dotaz? To je tak na 5 minut i s hledáním v dokumentaci, nemyslíš?
SQL je v podstatě jazyk pro komunikaci s databází (v databázi je všechno uložený). Kdybys měl přístu k databázi, stačí jí říct něco takovýho „select name from users where name like ‚%http%‘;“ a ono ti to vypíše všechny uživatele, kteří ve jménu mají http. Jenže ty přítup k databázi nemáš, protože jseš tam jen uživatel, že?
odpomass: ty se vyznáš, v prohramování? nešlo by to provést čistě „textově“?
Z celé stránky se vytáhne text, uloží se do nějakého textového dokumentu a program by pak oddělil jednotlivé příspěvky od sebe. Každý příšpěvek v diskuzi totiž začíná stejným textem, a to „Jméno:“. A pak už by to prohledávalo v jednotlivých odstavcích tu sekvenci znaků, a pokud by byl nález pozivitvní, vyhodilo by to jméno uživatele (text který se nachází slovy „Jméno:“ a „Datum:“ .
Přijde mi, že to nemůže bejt tak složitý. O něco podobnýho sem se totiž kdysi pokoušel v excelu, ale nešel nenašel jsem způsob jak oddělit odstavce od sebe, jako by to byly jednotlivé celky.
No, tak to bych možná spíš viděla na nějakej plugin do prohlížeče, ale fakt nevim, k čemu ti to bude a proč ti nestačí CTRL+F…
A existuje nějakej takovej plugin? CTRL+F je v tomhle případě k ničemu, trvalo by to týdny. Program by to jistě zvládl za několik málo vteřin, a pokud by se v tom někdo vyznal a dokázal to vyprodukovat za několik minut…
Když já zas nevim co to je, a to bych musel nejspíš dlouze studovat ne? :) A mám jistotu že až to všechno nastuduju, tak že to opravdu půjde?
Pokud s tím někdo umíte dělat, tak mě prosím poraďte co a jak.
Hochu, v životě se prostě musíš učit novým věcem. Zvlášť, pokud je chceš ovládat ;) A myslím, že tvůj účel tenhle software splní…
Bolak: odpomass a l564 hlavně předpokládají, že ty jseš provozovatel webu resp. tvůrce webu. Já nevim proč, ale já si myslím, že ty chceš takhle analyzovat web někoho jinýho. Je to tak?
To „mám“ je zřejmě matoucí. Nikoliv „mám“ jako že vlastním, ale „mám“ jako že „mám před sebou“.
Přesně tak, kdybych si uměl naprogramovat vlastní stránky, tak bych s tímhle nejspíš neměl problém :)
Bedy | 1528 | |
Michal Kole | 1199 | |
led | 1156 | |
Hlada | 1131 | |
mosoj | 1124 | |
gecco | 904 | |
www | 828 | |
badisko | 817 | |
cochee | 814 | |
Dochy | 725 |
Software |
Hardware |
Internet |
Programování a webdesign |
Sítě |
Bezpečnost |
Ostatní počítače a internet |