Obsah fóra www.novezahradnimesto.net www.novezahradnimesto.netPortál
 Nápověda  •  Hledat  •  Možnosti  •  Kronika  •  Soubory  •  Nové příspěvky  •  Digests  •  Registrace  •  Přihlásit pro kontrolu soukromých zpráv  •  Přihlášení
Kalendář 
Zobrazit následující téma
Zobrazit předchozí téma

Odeslat nové témaOdpovědět na téma Zobrazit předchozí témaPošlete e-mail kamarádovi.Seznam uživatelů kteří si prohlíželi tento příspěvekUložit téma do souboruPrintable versionPřihlásit pro kontrolu soukromých zprávZobrazit následující téma
Autor Zpráva
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 6.4.2006, 20:47  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

Tak maximum co sa mi z toho podarilo dostat je toto: "bezpøedmìtné"
To ked prepnem do UTF8. Ked to prepnem na ISO-8859-2 alebo Win1250 tak to je uplne rozsypane.
Netusite niekto co s tymě Jak je mozne ze v ziadnom charsete sa henten text nezobrazi tak ako mač
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 6.4.2006, 21:34  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
Pocuj, to nie je taky zly napad, udelujem ti zlatu plaketu D. Kunovskeho!
A co je este pozitivnejsie, pozeram dump tabulky nzm_search_wordlist a tam su vsetky tie slova v poriadku! Akurat ze netusim ake je to kodovanie atd. pretoze to je sejvnute v takomto formate nejakom:

INSERT INTO `nzm_search_wordlist` VALUES (0x383030, 1777, 0);
cize text je tam kodovany do hex values ale ked to importnem do tabulky co som vytvoril tak tam diakritika je (nie su otazniky) ale je rozbita. Skusal som dat collation tabulky cp1250 aj latin2 aj latin1, furt nic, stale je to nahovno.

Nemate chut niekto sa s tym pohrat a vyskumat ako treba nastavit tabulku/kodovanie/neviemco aby sa to do databazy importlo spravne?
respektive uplne by mi stacilo ak by ste to importli niekde k sebe so spravnou diakritikou a potom z toho vytiahli len tie slova a tie mi poslali v obycajnom textovom file...

ta tabulka je tu: http://www.novezahradnimesto.net/wordlist

A ked sa to podari tak je teda celkom slusna sanca ze sa podari obnovit tu diakritiku pretoze v tom wordliste by IMHO mali byt uplne vsetky slova ake sa tu kedy pouzili (je tam 41 tisic riadkov)


No zkousel jsem zadat nektery ty hexovy value sem:

http://www.cybermachine.org/

a pustit na to Hex 2 ASCII, ale stejně to vylezlo zmršený ...

např. 0x7679706fc3a8c3ad74c3a176c3a16e >> vypoèítává
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 6.4.2006, 21:36  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

dcom napsal:
JoHnY napsal:
Pocuj, to nie je taky zly napad, udelujem ti zlatu plaketu D. Kunovskeho!
A co je este pozitivnejsie, pozeram dump tabulky nzm_search_wordlist a tam su vsetky tie slova v poriadku! Akurat ze netusim ake je to kodovanie atd. pretoze to je sejvnute v takomto formate nejakom:

INSERT INTO `nzm_search_wordlist` VALUES (0x383030, 1777, 0);
cize text je tam kodovany do hex values ale ked to importnem do tabulky co som vytvoril tak tam diakritika je (nie su otazniky) ale je rozbita. Skusal som dat collation tabulky cp1250 aj latin2 aj latin1, furt nic, stale je to nahovno.

Nemate chut niekto sa s tym pohrat a vyskumat ako treba nastavit tabulku/kodovanie/neviemco aby sa to do databazy importlo spravne?
respektive uplne by mi stacilo ak by ste to importli niekde k sebe so spravnou diakritikou a potom z toho vytiahli len tie slova a tie mi poslali v obycajnom textovom file...

ta tabulka je tu: http://www.novezahradnimesto.net/wordlist

A ked sa to podari tak je teda celkom slusna sanca ze sa podari obnovit tu diakritiku pretoze v tom wordliste by IMHO mali byt uplne vsetky slova ake sa tu kedy pouzili (je tam 41 tisic riadkov)


No zkousel jsem zadat nektery ty hexovy value sem:

http://www.cybermachine.org/

a pustit na to Hex 2 ASCII, ale stejně to vylezlo zmršený ...

např. 0x7679706fc3a8c3ad74c3a176c3a16e >> vypoèítává


ale tak me napada ... zkusim to importnout k sobe a pak vyexportovat ...
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 6.4.2006, 21:48  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

no skus to... ak by to slo tak by to bolo najlepsie riesenie
to by chcelo dakeho charset guru-a
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 6.4.2006, 21:51  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

inac to je presne to co mne z toho lezie... daj si to tam encodnut a potom si prepni kodovanie na UTF8 natvrdo v browseri... vylezie ti z toho nieco ako som sem ja pastoval... ze to vyzera aspon zhruba ako keby to chcelo byt spravne
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 6.4.2006, 21:54  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
inac to je presne to co mne z toho lezie... daj si to tam encodnut a potom si prepni kodovanie na UTF8 natvrdo v browseri... vylezie ti z toho nieco ako som sem ja pastoval... ze to vyzera aspon zhruba ako keby to chcelo byt spravne


jasne ... no pohraju si s tim zejtra ...
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 6.4.2006, 21:56  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

ja idem tiez spat, nech zajtra vecer nieco vydrzim Very Happy
zatial bye
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
MUSTANG
Domácí
Domácí



Založen: 7.2.2006
Příspěvky: 756


czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 07:21  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

ja se taky muzu pokusit. Ted v praci se k tomu urcite nedostanu, ale muzu to zkusit odpoledne nebo pres vikend...
 Pohlaví:Muž  SkrytýOsobní galerie MUSTANGZobrazit informace o autoroviOdeslat soukromou zprávu
Milan V.
Administrator
Administrator



Založen: 25.4.2005
Příspěvky: 2123
Bydliště: NZM A

blank.gif

PříspěvekZaslal: 7.4.2006, 07:25  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

MUSTANG napsal:
ja se taky muzu pokusit. Ted v praci se k tomu urcite nedostanu, ale muzu to zkusit odpoledne nebo pres vikend...
Inu, proč ne, že ano. Pokud to dokážeš, o práci míň pro nás ... Wink
   OfflineOsobní galerie Milan V.Zobrazit informace o autoroviOdeslat soukromou zprávuICQ
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 7.4.2006, 09:27  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

no pocuvajte najdite medzi sebou dakeho character-set-mysql gurua lebo ja sa vzdavam, absolutne tomu nerozumiem a tam sa ten character set nastavuje na tolkych miestach ze to musel vymyslat nejaky ...
aktualne som chcel zmenit character set pre tabulku attachmentov lebo tam diakritika tiez bola ale daka divna, ked to zmenim tak su tam hned otazniky, a ked to zmazem, zmenim a znovu importnem tak je to furt rozhadzane
a tych moznosti ako a kde nastavit charset je tolko ze keby som to mal skusat tak to mam na mesiac prace.
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
MUSTANG
Domácí
Domácí



Založen: 7.2.2006
Příspěvky: 756


czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 09:46  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

hm, tak to je zle, vypada to, ze pri kazde akci se bere v potaz jina konfigurace. Tyhle free udelatka jsou dobry, kdyz se nainstalujou a nechaj bejt a nesaha se na ne a nic se jim nahodou nestane Sad. Bohuzel soudruzi vyvojari jsou vetsinou ze zemi, kde o diakritice nikdo moc nepremysli, vzdyt ji pouziva jen par pidinarodu na druhym konci sveta Smile

Moc se mi ale nezda, ze by zmena konfigurace okamzite vyvolala update dat. To je bud nejaky omyl, chyba nebo to vymyslel nejaky tululum. Na databazi o std. velikosti by si taky mohl vzit par dni dovolenou Smile a cekat az se to zupdatne. nemuzu si pomoct ale tomu neverim. kdyz zmenis konfiguraci DB a nezmenis klienta tak to muze byt vevnitr porad dobre ale po vyselektovani/exportu/dumpu to muze byt spatne (diky standardni konverzi mezi enforceovanym charsetem DB files a klienta). Zkusil sis DB soubory prohlednout primo binarnim editoremě
 Pohlaví:Muž  SkrytýOsobní galerie MUSTANGZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 7.4.2006, 09:50  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

problem je zrejme v tom ze ja som to zmenil sice len v konfiguracii servera, lenze ako board bezal tak tam sli nejake updaty/altery/neviemco ktore to znicili...
pretoze tabulky ktore sa nevyuzivali (ako napriklad ta tabulka attachmentov) su v pohode, ale to ostatne je dodrbane
takze to bude najskor ten problem
to uz je ale jedno, terat treba vymysliet ako to napravit
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 7.4.2006, 10:14  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

pozeram znovu ten wordlist a tam pre znaky s diakritikou su dve hex values. to znamena ze to je v utf, nie? teda ako vravim, v tomto som uplne mimo ale z toho co som pochopil teraz co som cital tak utf pouziva pre znaky 128-32767 prave dve hex hodnoty. je to taKč
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
MUSTANG
Domácí
Domácí



Založen: 7.2.2006
Příspěvky: 756


czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 10:16  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

muze to byt obecne jakakoli forma Unicode, BigEndian/LittleEndian

http://www.unicode.org/faq/utf_bom.html
 Pohlaví:Muž  SkrytýOsobní galerie MUSTANGZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 7.4.2006, 10:24  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

MUSTANG napsal:
muze to byt obecne jakakoli forma Unicode, BigEndian/LowEndian


no ano, tak som to myslel, len mi nedoslo najprv ze to bude _nejaky_ unicode
a da sa teda nejako zistit co to je a previest to do rozumnej formy?

ja zacinam rozmyslat nad tym ze spravit to uplne jednoducho, tych diakritickych znakov je zopar, pozriet aku hodnotu ma kazdy v tom hex, a nahradit tie dve values jednou v cp1250
to bude asi najjednoduchsie, nie?

nech zhoria v pekle ti co vymysleli diakritiku
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 10:33  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
MUSTANG napsal:
muze to byt obecne jakakoli forma Unicode, BigEndian/LowEndian


no ano, tak som to myslel, len mi nedoslo najprv ze to bude _nejaky_ unicode
a da sa teda nejako zistit co to je a previest to do rozumnej formy?

ja zacinam rozmyslat nad tym ze spravit to uplne jednoducho, tych diakritickych znakov je zopar, pozriet aku hodnotu ma kazdy v tom hex, a nahradit tie dve values jednou v cp1250
to bude asi najjednoduchsie, nie?

nech zhoria v pekle ti co vymysleli diakritiku


"nech zhoria v pekle ti co vymysleli diakritiku" tak s tim nelze nez souhlasit Laughing Razz Cool
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 10:36  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

jinak nainstaloval jsem si na testovacim stroji phpmyadmina a zkousim to opravit ...
_________________
Dcom
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 7.4.2006, 10:40  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor


Naposledy upravil JoHnY dne 7.4.2006, 10:44, celkově upraveno 2 krát.
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 7.4.2006, 10:47  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

btw nzm_search_wordlist ma okolo 40k riadkov, nzm_search_wordmatch okolo 250k a nzm_posts_text asi 6k
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
MUSTANG
Domácí
Domácí



Založen: 7.2.2006
Příspěvky: 756


czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 11:21  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
nech zhoria v pekle ti co vymysleli diakritiku


no myslim, ze stacilo, aby prvni pocitac nebyl vynylezen v Anglii ale nekde v jazykove bohatsi zemi = Indie, Rusko, Československo (s pomlčkou nebo spojovníkem nebo i bez něj, jak kdo chce Smile), Polsko, Japonsko, Čína. Ono to presne ukazuje ne cestu nejmensiho odporu. My si to udelame takhle, nam to bude stacit a ostatni maji smulu Smile Ostatne co cekat. Pocitace byly vojenska technologie a nejaky zajem o univerzalnost natoz celosvetovou tenkrat rozhodne nebyl Smile
 Pohlaví:Muž  SkrytýOsobní galerie MUSTANGZobrazit informace o autoroviOdeslat soukromou zprávu
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 11:34  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor


... no v tom puvodnim fajlu co si sem dal jsou ty slova zakodovany v hexa ... naimportoval jsem si to a pak vyexportoval, tak ze jsou slova uz plain text no a zkousel jsem projet ruzny kodovani, ale bez uspechu ...

... to reseni jak navrhujes je asi dobry, ale bohuzel se zda, ze ta diakritika je totalne v ... Rolling Eyes
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 7.4.2006, 11:47  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

dcom napsal:
JoHnY napsal:
a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor


... no v tom puvodnim fajlu co si sem dal jsou ty slova zakodovany v hexa ... naimportoval jsem si to a pak vyexportoval, tak ze jsou slova uz plain text no a zkousel jsem projet ruzny kodovani, ale bez uspechu ...

... to reseni jak navrhujes je asi dobry, ale bohuzel se zda, ze ta diakritika je totalne v ... Rolling Eyes


ale ved kazdy znak tam ma nejaky kod, nie? snad to nie je uplny bordel a 3f tam nie je miesto diakritiky
cize to co som navrhol v jednej sprave pred touto na ktoru si reagoval by malo predsa ist, logicky
ked je v tom subore cojaviem 0x3830 vzdy namiesto "č" tak nie je problem 0x3830 replacnut spravnym kodom v cp1250
hm?
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 12:38  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
dcom napsal:
JoHnY napsal:
a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor


... no v tom puvodnim fajlu co si sem dal jsou ty slova zakodovany v hexa ... naimportoval jsem si to a pak vyexportoval, tak ze jsou slova uz plain text no a zkousel jsem projet ruzny kodovani, ale bez uspechu ...

... to reseni jak navrhujes je asi dobry, ale bohuzel se zda, ze ta diakritika je totalne v ... Rolling Eyes


ale ved kazdy znak tam ma nejaky kod, nie? snad to nie je uplny bordel a 3f tam nie je miesto diakritiky
cize to co som navrhol v jednej sprave pred touto na ktoru si reagoval by malo predsa ist, logicky
ked je v tom subore cojaviem 0x3830 vzdy namiesto "č" tak nie je problem 0x3830 replacnut spravnym kodom v cp1250
hm?


jo, tak to asi jo ... Wink Cool
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 7.4.2006, 12:42  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

no dobre, vecer sa na to napijem a uvidime Very Happy
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 12:45  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
no dobre, vecer sa na to napijem a uvidime Very Happy


jasne Razz Drink Drink Drink Tanec
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 8.4.2006, 18:19  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

no, podarilo sa mi napravit to kodovanie, netusim ako sa podarilo tomu mysql replacnut tie znaky, proste tam boli uplne ine znaky ako mali byt
a bolo to presne 5 znakov
tu je moja prekladova tabulka

prva je povodna hodnota utf-8, druha nova

c3b8 - c599 ř
c3a8 - c48d č
c3ac - c49b ě
c3af - c48f ď
c3b9 – c5af ů

http://johny.sk/n.sql
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 9.4.2006, 11:38  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

Tak, hotovo, diakritika opravena.

Akurat ze sa vsetko zmenilo na lowercase, ked bolo slovo v ktorom bola pokaslana diakritika, ale to az tak nevadi dufam.

Ale ak by sa niekomu chcelo rozmyslat nad tym ako to spravit aby to zachovalo aj ten case tak nech napise, nie je problem to spravit.

Inac skript ktorym som to spravil je tu ak by to niekoho zaujimalo: http://johny.sk/nzm2.phps
Trvalo to asi 20 sekund.
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 9.4.2006, 11:41  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

Tak pozeram ze este "ť" musim zmenit
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 47
Založen: 18.10.2005
Příspěvky: 3141
Bydliště: Praha - Bratislava - Závažná Poruba

european union1.png

PříspěvekZaslal: 9.4.2006, 12:33  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

uz je to snad vsetko, ak uvidite este nejake neprelozene znaky tak dajte vediet
vlastne este by som sa mohol pokusit sukromne spravy opravit

...aale, nie, na to kaslem, tam nie je ziadny wordmatch vlastne... takze kto pise sukromne spravy s diakritikou musi sa s tym vyrovnat

ale ak by niekomu napadlo ako to spravit aby zostali aj tie velke pismena na zaciatkoch viet a podobne tak napiste, to este mozem spravit...

edit: fuha, aj to sa mi podarilo... tam totiz nebola zmrsena ta diakritika v tabulkach, len nesedelo kodovanie.

...este rebuildnut search index a bude to vsetko...
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 54
Založen: 25.3.2006
Příspěvky: 1632
Bydliště: Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 9.4.2006, 13:09  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
uz je to snad vsetko, ak uvidite este nejake neprelozene znaky tak dajte vediet
vlastne este by som sa mohol pokusit sukromne spravy opravit

...aale, nie, na to kaslem, tam nie je ziadny wordmatch vlastne... takze kto pise sukromne spravy s diakritikou musi sa s tym vyrovnat

ale ak by niekomu napadlo ako to spravit aby zostali aj tie velke pismena na zaciatkoch viet a podobne tak napiste, to este mozem spravit...

edit: fuha, aj to sa mi podarilo... tam totiz nebola zmrsena ta diakritika v tabulkach, len nesedelo kodovanie.

...este rebuildnut search index a bude to vsetko...


great work Wink Cool
Kozoroh Pohlaví:Muž Kohout OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávu
Zobrazit příspěvky z předchozích:      
Odeslat nové témaOdpovědět na téma Zobrazit předchozí témaPošlete e-mail kamarádovi.Seznam uživatelů kteří si prohlíželi tento příspěvekUložit téma do souboruPrintable versionPřihlásit pro kontrolu soukromých zprávZobrazit následující téma

Zobrazit následující téma
Zobrazit předchozí téma
Nemůžete odesílat nové téma do tohoto fóra
Nemůžete odpovídat na témata v tomto fóru
Nemůžete upravovat své příspěvky v tomto fóru
Nemůžete mazat své příspěvky v tomto fóru
Nemůžete hlasovat v tomto fóru
Nemůžete připojovat soubory k příspěvkům
Můžete stahovat a prohlížet přiložené soubory


Časy uváděny v GMT + 1 hodina

CrackerTracker © 2004 - 2024 CBACK.de
Powered by phpBB2