EXCEL - převedení dat (e-mailů) z Wordu
Ahoj, převzal jsem po kolegovi klientskou databázi e-mailů v MS Wordu a potřeboval bych ji kompletně převést do Excelu. Zkoušel jsem si hrát s importem dat, ale nedaří se. Jde mi jenom o jednotlivé e-mailové adresy, které by v ideálním případě měly být jako buňky v jednom sloupci (výsledný stav). Ve Wordu jsou data zapsaná v několika formátech:
jmeno@domena.com <jmeno@domena.com>; jmeno2@domena.com <jmeno2@domena.com>; jmeno3@domena.com <jmeno3@domena.com>; ...
Jméno Příjmení <jmeno@domena.com>; Jméno Příjmení 2 <jmeno2@domena.com>; Jméno Příjmení 3 <jmeno3@domena.com>; ...
"Jméno Příjmení" <jmeno@domena.com>, "Jméno Příjmení 2" <jmeno2@domena.com>, "Jméno Příjmení 3" <jmeno3@domena.com>, ...
jmeno@domena.com, jmeno2@domena.com, jmeno3@domena.com, ...
Poradí někdo jak na to?
Je toho celkem dost, takže případná ruční úprava dat prosím až jako poslední možnost...
Ahoj,
1) Zkopíruj data do excelu,
2) vše označ, vyber kartu data, nástroj "Text do sloupců",
3) vyber oddělovač a dej další,
4) oddělovače budou mezery, čárky a středníky, dokončit
5) sloupce s duplicitními hodnotami odstraň.
Snad to pomůže.
Díky za rychlou reakci. K nějakému podobnému výsledku jsem se dostal po importu textu. Vypadá to teď asi tak, že mám data rozdělená (e-maily a texty zvlášť v buňkách), ale jsou řádově v desítkách sloupců. Možná je problém už u prvního kroku - jak správně zkopírovat data vložit do Excelu? Nebo kdyby šlo nějakou další úpravou dostat všechno pod sebe do jednoho sloupce?
Tak to půjde buď ručně - přetahat sloupce, nebo makro, ale s tím ti neporadím.
Nevím, s jakou verzí MSO pracujete, ale u starších verzí (97-2000) bylo potřeba najdříve ještě ve Wordu převést tabulku na text a odstranit tvrdé konce řádků a teprve potom udělat import do Excelu. Možná je to u nových verzí nějak jednodušší.
Mělo by na to stačit pár nahrazování - udělal jsem ti postup včetně postupných mezivýsledků - nezapomeň na mezery (zobrazené jako tečky) a mít ve správný okamžik zapnuté nebo vypnuté zástupné znaky...
Ahoj, moc díky za návod i za nakopnutí. Nefunguje mi třetí krok odstranění textů (^13?* \<→^p) a to ani na vzorku v Tvém souboru. Vlastně mi už nefungoval ani krok odstranění uvozovek předtím ("?*" →nic), ale to jsem ještě nějak pořešil. Teď si nevím rady...
A zapnul jsi volbu "Použít zástupné znaky"???
Samozřejmě nezapnul, až teď. Takže mohu potvrdit, že i tenhle postup vede k cíli. Ještě jednou díky!
Nie je mi jasné, či chceš získať len e-mail v základnom tvare (jmeno@domena.com) alebo celú e-mailovú adresu ("Jmeno Prijmeni" <jmeno@domena.com>). V každom prípade by som si to uložil do textového súboru a potom na to použil grep, ktorý si môžeš stiahnuť niekde z webu.
Ak chceš celú e-mailovú adresu, tak:
Ak chceš e-mail v základnom tvare, tak napríklad takto:
Jenom čisté e-maily. Grep mi bohužel nic neříká (pohledám), úplně by vyhovoval postup s nahrazováním od JoDiKa, bude to pravděpodobně jenom nějaká drobnost...
Grep si stiahni napríklad odtiaľto a máš to za 5 sekúnd hotové: grep-2.10-w32-bin.zip
Edit: Ešte napíšem pre istotu postup:
1. Stiahneš a rozbalíš grep do nejakého adresára, napr. C:\nejaky_adresar.
2. Tie e-maily uložíš ako textový súbor do rovnakého adresára, napr. vstup.txt.
2. Otvoríš príkazový riadok (Win+R, cmd).
3. Presunieš sa do toho adresára (cd C:\nejaky_adresar).
4. Spustíš príkaz s tým, že výstup presmeruješ do súboru, takže pre čisté e-maily takto:
5. Zoznam e-mailov budeš mať v súbore vystup.txt.
Díky za popsaný postup. Vytvoří se mi ale prázdný soubor. Čím by to mohlo být?
A v príkazovom riadku sa nevypísala žiadna chyba? Ak nie, tak to môže byť spôsobené len tým, že sa v tom súbore vstup.txt nenachádzajú žiadne e-maily. Uložil si ten súbor po tom, ako si do neho vložil text s e-mailovými adresami?
Bohužel, maily tam jsou, spustím příkaz, vytvoří se vystup.txt, ale prázdný. Žádná chyba vypsaná není, nebo jí nevidím (TC).
Spusti toto, že či bude vystup.txt stále prázdny:
Není prázdný.
Takže predpokladám, že vieš, aký je problém. Ak nie, tak sem napíš obsah a posunieme sa ďalej.
Kde je problém, netuším. První tři řádky ve vstup.txt vypadají takhle:
odstránené e-maily (los)
Mňa nezaujíma vstup, ale výstup. Pri spustení toho príkazu nastala totižto nejaká chyba, ktorú by si v príkazovom riadku videl. Keďže neviem, ako to spúšťaš, tak som do výstupného súboru presmeroval aj chybové hlásenia. Teraz si už len stačí to chybové hlásenie prečítať a porozumieť mu.
grep nenˇ n zvem vnitýnˇho ani vnŘjçˇho pýˇkazu, spustiteln‚ho programu nebo d vkov‚ho souboru.
Ten grep, ktorý si stiahol a rozbalil, musí byť v rovnakom adresári ako vstup.txt. Príkaz musíš spúšťať tiež z toho istého adresára.
Edit: Ak to máš v rovnakom adresári, tak klikni na grep pravým tlačidlom myši a vo vlastnostiach stlač Odblokovať.
Edit2: Zo stiahnutého ZIPu je dôležitý len adresár bin, v ktorom je grep.exe (a nejaké dll). To je ten grep, ktorý chceme spustiť, takže v tomto adresári musí byť aj ten TXT súbor.
Bingo! Chyběla mi informace Edit2, teď už to proběhlo jak mělo a výsledek je přesně co jsem chtěl. Snad to pomůže i někomu dalšímu. Díky za trpělivost!
P.S. Až teď vidím vstup2.txt. Ale stejně nevím, co s tím...
Ten vstup2.txt má byť vstup.txt, to som sa preklepol.
Ale když vidím ten texťák, tak by vážně stačilo odmazat (najít / nahradit) všechno na řádku před znakem "<", potom odmazat znaky "<" a ">", a bylo by hotovo. Jenom jak na to?
viz nahoře...