Autor Zpráva
radas
Profil *
Zdravím,
zpracovávam několik xml souboru u kterých, ukladam nazev, obsah, url, adresa obrazku - jde o zprávy.
Zpočátku bylo těch xml souboru malo, tak jsem aktualizaci řešil vymazáním cele tabulky (interval 6h) a znovu zpracováním všech xml soubory. Teď mám problém, že těch xml souboru je podstatně více a zpracování trva cca 120s a během toho zpracování se blokuje server (neda se na něho připojit)

Moje uvaha je, že budu muset zpracovat xml soubory o menším počtu třeba 5x spustit skript, který zpracuje 5xml souboru, jenže nevím jak oddělit již "aktualizovane" od "neaktualizovaných" aniž bych tabulku vymazal ...
Jax
Profil *
Tak tohlencto mě také zajímá. Už máš nějaké řešení?
radas
Profil *
no asi to udělam tak že tam přidam sloupec aktualizace, kde budu ukladat jen hodinu kdy ma byt provededa další aktualizace,
porovnávat to budu podle url (ta by měla byt jedinečna) ,neaktualizovane smažu zbyvajici přidam a tak pořad dokola...ale tohle řešení mi nepřijde uplně 100% ale lepší mě nenapada...
Joker
Profil
radas:
A je nutné všechno smazat a pak znovu aktualizovat?
Pokud se mění jen část dat, bylo by možná výhodnější aktualizovat jen to co se skutečně změnilo a ne všechno.
Každopádně „aktualizace dat“ vymazáním a přeplněním celé tabulky je trochu zvláštní (někdy to může být nejlepší řešení, ale většinou ne).

Jinak přidat čas expirace nebo čas poslední aktualizace je možnost.
Další možnost by byla přidat příznak aktuální/neaktuální. Na začátku aktualizace by se příznak u všech záznamů shodil a u těch aktualizovaných by se zase nastavil.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0