Autor Zpráva
majo80
Profil *
Zdravím.
Potreboval by som spracovať jeden textový súbor, ktorý neobsahuje žiadne obrázky, čisto iba text ale má veľkosť niečo cez 5GB (je to záloha databázy).
Potreboval by som to napr. aj len rozdeliť na menšie časti, povedzme po 100MB, tie už by som si spracoval.

Majo
_es
Profil
majo80:
„Spracovať“ ako? V nejakom programovacom jazyku?
majo80
Profil *
Nie. Skôr chcem tento súbor buď priamo upraviť - mazať niektoré riadky - alebo čo bude asi najlepšie riešenie, rozdeliť tento súbor do menších celkov, napr. po tých 100MB.Tie už otvorím aj v PSpade a upravím podľa potreby.
Ide o to že som nikde nenašiel program, ktorý by dokázal pracovať s takto veľkým súborom bez toho aby nezamrzol...
Keeehi
Profil
Asi bych použil na linuxu split. Případně si napsat scriptík v C.
juriad
Profil
pokud znáš řádky, které chceš odstranit (a toto je více méně jediná operace), tak doporučuji unixový sed
vyžaduje sice příkazovou řádku, ale zvládne jakoukoli práci se souborem popsatelnou regulárními výrazy a velikost mu nedělá problém

jinak zmíněný split, taktéž řádkový
představu si udělej googlením "man split"
majo80
Profil *
A vo windowse nič také nieje?
Keeehi
Profil
majo80:
No asi je, ale vůbec s tím neumím (nepotřebuji to). Pokud ti jde o windows, tak pak ten scriptík v C/C++.
majo80
Profil *
A môžeš poradiť niekoho, kto by mi to mohol naprogramovať a približne za akú cenu?
Keeehi
Profil
majo80:
Když chvíli počkáš, tak klidně i já. A zadarmo. Jen potřebuji znát parametry.
- jestli to sekat podle počtu znaků (velikost) nebo podle řádek (počet příkazů); u první možnosti se ti stane, že část příkazu bude na konci jednoho souboru a část na začátku druhého
- jak velké mají být ty jednotky
- jak se mají jmenovat ty výstupní soubory
majo80
Profil *
To by bolo super. Takže:
1) je to prakticky jedno, určite by bolo výhodnejšie to deliť po riadkoch ale ak to je zložitejšie na programovanie tak stačí aj po znakoch
2) deliť po zhruba 100 MB jeden súbor
3) úplne jedno, oddeliť iba číslom, napr. temp_1, temp_2 ..... až temp_251
Keeehi
Profil
majo80:
http://ul*z.to/13216566/split-exe
Vstupní soubor se musí jmenovat in.txt, musí být umístěn ve stejné složce jako script split.exe
Mělo by to vytvářet 100MB soubory + pár bytů na dokončení řádky.
Soubory se budou vytvářet zase ve stejné složce.
Omezení je 1000 souborů, ale u 5GB by jich mělo být jen 50, takže OK.
majo80
Profil *
Funguje to perfektne...
Len by som Ťa chcel poprosiť o malú zmenu, aby to rozdelilo po 50MB. Aj tých 100MB je pre PSpad veľa na spracovanie :-)
Ale naozaj ďakujem za veľkú ochotu a rýchle vytvorenie...
Keeehi
Profil
http://ul*z.to/xZ7qQCt/split-exe
Alphard
Profil
Keeehi:
Já exe spouštět nebudu, ale velikost a název vstupního souboru by bylo dobré zadávat parametrem :-)
Nebo jsem v rychlosti našel http://stackoverflow.com/a/159537
Keeehi
Profil
Alphard:
No je to jednorázový script, takže jsem to tam dal natvrdo. Jinak samozřejmě by to šlo. Parametrem by šlo zadat i cílové umístění, nebo typ dělení ale proč se s tím dělat.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: