Autor Zpráva
Pavel9876
Profil *
Zdravím,
mám script, který zpracovává soubory a ukládá data do tabulky a chtěl bych ošetřit, aby se konkrétní soubor zpracoval jen jednou, proto hodlám také s daty ukládat i název souboru.

Tabulka ale může v delším horizontu obsahovat i víc jak milion záznamů. Nebude pak vyhledávání v takové tabulce na základě porovnávání názvu souboru a hodnoty v daném sloupci trvat s přibývajícím počtem řádků znatelně déle? Napadlo mě, že bych nad tímto sloupcem vytvořil index, ale nejsem si jistý, jestli to funguje i s řetězci a jestli to není nějak kontraproduktivní, vzhledem k tomu, že by delší dobu mohlo trvat přidávání toho záznamu, než vyhledávání v tabulce...

Děkuji za názory, Pavel
Kajman
Profil
Nejjednodušší je si to zkusit a změřit v daném případě, zda je přínos hodný řežie navíc.

Pokud bude řetězec dlouhý, může se nastavit indexování pouze určitého počtu prvních znaků, případně si jako typ indexu zvolit hash.

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: