Discussion:
Jak ujednolicić duży tekst?
(Wiadomość utworzona zbyt dawno temu. Odpowiedź niemożliwa.)
bzdreg
2012-06-09 03:43:07 UTC
Permalink
Witam.
Wiem, że należało to robić przed napisaniem tego dużego dokumentu, ;)
ale włączyłem się w to na obecnym etapie, pomagam redaktorowi naukowemu
słabo obeznanemu z OOo.
Dokument, to książka na 1.5mln znaków (ok. 40 ark.). Składa się z ~30
części pisanych przez różnych autorów, przeważnie w MSWordzie. Każdy
formatował inaczej. Leży to więc w postaci 30 plików.
Hierarchia dokumentu - w zasadzie dwupoziomowa, w śródtytuły autorów już
nie będę ingerował.
Nie ma żadnych wytycznych od wydawnictwa, poza bardzo typowymi.

A zadanie sprowadza się do ujednolicenia całości. Co do stylów i
formatowania, raczej będzie to redukcja do niezbędnego minimum, tj kilka
poziomów nagłówków, jeden styl akapaitu, jeden przypisów dolnych, jeden
do not bibliograficznych.

Jak to zrobić?
--
Dziękuję i pozdrawiam. Bzdreg.
MaGorEc
2012-06-10 07:39:54 UTC
Permalink
Post by bzdreg
Witam.
Wiem, że należało to robić przed napisaniem tego dużego dokumentu, ;)
ale włączyłem się w to na obecnym etapie, pomagam redaktorowi naukowemu
słabo obeznanemu z OOo.
Dokument, to książka na 1.5mln znaków (ok. 40 ark.). Składa się z ~30
części pisanych przez różnych autorów, przeważnie w MSWordzie. Każdy
formatował inaczej. Leży to więc w postaci 30 plików.
Hierarchia dokumentu - w zasadzie dwupoziomowa, w śródtytuły autorów już
nie będę ingerował.
Nie ma żadnych wytycznych od wydawnictwa, poza bardzo typowymi.
A zadanie sprowadza się do ujednolicenia całości. Co do stylów i
formatowania, raczej będzie to redukcja do niezbędnego minimum, tj kilka
poziomów nagłówków, jeden styl akapaitu, jeden przypisów dolnych, jeden
do not bibliograficznych.
Jak to zrobić?
Pracujesz w Windows? Po nagłówkach wiadomości tak wnoszę. Trudno mi się
wypowiedzieć na temat możliwości OO w Okienkach.
Co do rozwiązania jakiego ja bym próbował.
1. eksport pliku Word do xml
2. edycja xml -> stworzenie nowej klasy/nowych klas, takich jakie chcesz
mieć w wyjściowym dokumencie - najlepiej w zewnętrznym arkuszu .css, coby
podmiana była łatwa, szybka i przyjemna.
3. Sprytna podmiana klas w kolejnych dokumentach - edycja w edytorze
tekstu - analizujesz klasy występujące w dokumencie Word i albo
pojedynczo albo seryjnie zastępujesz je swoim wpisem (ew. wpisem
linkującym do arkusza .css)
4. import zmodyfikowanych xml do OOo.
5. Połączenie dokumentów - tu też trzeba działać z głową i rozejrzeć się
po manualu albo poszukać w necie dobrych praktyk :)

Spróbuję coś takiego przeprowadzić u siebie (natchnąłeś mnie myślą o
uporządkowaniu pewnego zbioru dokumentów :)) i jak coś to zapodam info o
efektach.

Oczywiście możesz rzeźbić ręcznie i zdefiniować nowe style dla stron,
akapitów, rozdziałów i potem je aplikować z poziomu interfejsu ale nie
wiem czy to nie więcej roboty. Może moje rozwiązanie jest prostsze dla
mnie bo ja mam do dyspozycji terminal, w którym mogę dużą część tych
operacji wykonać w sposób zautomatyzowany.

Pozdrawiam
Maciek

PS. Pierwsze szybkie próby są obiecujące.
bzdreg
2012-06-10 14:22:16 UTC
Permalink
Post by MaGorEc
Post by bzdreg
Witam.
Wiem, że należało to robić przed napisaniem tego dużego dokumentu, ;)
ale włączyłem się w to na obecnym etapie, pomagam redaktorowi naukowemu
słabo obeznanemu z OOo.
Dokument, to książka na 1.5mln znaków (ok. 40 ark.). Składa się z ~30
części pisanych przez różnych autorów, przeważnie w MSWordzie. Każdy
formatował inaczej. Leży to więc w postaci 30 plików.
Hierarchia dokumentu - w zasadzie dwupoziomowa, w śródtytuły autorów już
nie będę ingerował.
Nie ma żadnych wytycznych od wydawnictwa, poza bardzo typowymi.
A zadanie sprowadza się do ujednolicenia całości. Co do stylów i
formatowania, raczej będzie to redukcja do niezbędnego minimum, tj kilka
poziomów nagłówków, jeden styl akapaitu, jeden przypisów dolnych, jeden
do not bibliograficznych.
Jak to zrobić?
Pracujesz w Windows? Po nagłówkach wiadomości tak wnoszę. Trudno mi się
wypowiedzieć na temat możliwości OO w Okienkach.
Co do rozwiązania jakiego ja bym próbował.
1. eksport pliku Word do xml
2. edycja xml -> stworzenie nowej klasy/nowych klas, takich jakie chcesz
mieć w wyjściowym dokumencie - najlepiej w zewnętrznym arkuszu .css, coby
podmiana była łatwa, szybka i przyjemna.
3. Sprytna podmiana klas w kolejnych dokumentach - edycja w edytorze
tekstu - analizujesz klasy występujące w dokumencie Word i albo
pojedynczo albo seryjnie zastępujesz je swoim wpisem (ew. wpisem
linkującym do arkusza .css)
4. import zmodyfikowanych xml do OOo.
5. Połączenie dokumentów - tu też trzeba działać z głową i rozejrzeć się
po manualu albo poszukać w necie dobrych praktyk :)
Spróbuję coś takiego przeprowadzić u siebie (natchnąłeś mnie myślą o
uporządkowaniu pewnego zbioru dokumentów :)) i jak coś to zapodam info o
efektach.
Oczywiście możesz rzeźbić ręcznie i zdefiniować nowe style dla stron,
akapitów, rozdziałów i potem je aplikować z poziomu interfejsu ale nie
wiem czy to nie więcej roboty. Może moje rozwiązanie jest prostsze dla
mnie bo ja mam do dyspozycji terminal, w którym mogę dużą część tych
operacji wykonać w sposób zautomatyzowany.
Pozdrawiam
Maciek
PS. Pierwsze szybkie próby są obiecujące.
Jeśli miałbyś się z tym napieprzać dla mojego dobra, to odpuść.
Robię ręcznie. Po nieskutecznym guglaniu i eksperymentowaniu, zamiast
czekać na pomysł/radę/sugestię wziąłem się do łopaty i jestem już w 1/3.

xml przerasta mój poziom pojmowania abstrakcji tekstu.

Sam (aktualnie) owszem, w Windows, ale wspomniany "redachtór", czyli
moja żona - na Linuxie (skoro dla niej komp miał być tylko maszyną do
pisania i emailowania, to poskąpiłem kasy na Windę).
Wniosek na przyszłość tylko taki, że trzeba było zrobić szablony i
rozesłać ludziom z kategorycznymi wytycznymi, zanim zaczną pisać. Swoją
drogą - znajomość elementarnych zasad komputerowego redagowania tekstów
wśród adiunktów (bo profesorom, to już można wiele wybaczyć) jest
zatrważająca i powalająca. Po prostu rozpacz.
--
Dziękuję i pozdrawiam. Bzdreg.
MaGorEc
2012-06-10 16:34:55 UTC
Permalink
Post by bzdreg
Jeśli miałbyś się z tym napieprzać dla mojego dobra, to odpuść.
Robię ręcznie. Po nieskutecznym guglaniu i eksperymentowaniu, zamiast
czekać na pomysł/radę/sugestię wziąłem się do łopaty i jestem już w 1/3.
Spoko :) Już i tak to zrobiłem tylko nie mam za dużo czasu na nagranie
tego jeszcze raz z pulpitu. Przy okazji odkryłem drogę na skróty do
uporządkowania pewnej sprawy :) Dzięki za to.

Krótko o rozwiązaniu:
1. Wymagania: Linux z terminalem :D
2. Zainstalowane OOo albo LO
3. Dobry edytor html i xml, u mnie odpowiednio: kompozer i BlueFish
4. Rozwiązanie:
- wchodzisz do katalogu z zapisanymi dokumentami Worda
- odpalasz w nim terminal
- w terminalu wpisujesz: libreoffice --convert-to html --headless *.doc
- w wyniku powyższej operacji otrzymasz swoje dokumenty w formacie html
- zamykasz terminal i/lub odpalasz kompozer
- otwierasz utworzony plik html
- klikasz na ikonę CSS
- klikasz przycisk eksportuj do zewnętrznego pliku
- zapyta Cię o lokalizację - ja wybrałem folder z doc-ami - nazwa pliku:
style.css
- zapisujesz plik
- otwierasz sobie np. Blue Fishem plik style.css i oglądasz listę
wszystkich klas użytych do formatowania dokumentu
- ustawiasz w klasach co Ci się tam żywnie podoba (format, rozmiar
fontów, kolory, formaty tabelek itp. - do dyspozycji masz cały css)
- zaznaczasz wszystko od <head> do </head> i Ctrl + C (i najlepiej do
notatnika wkleić na zapas)
- otwierasz kolejny plik *.html (może być w Blue F.) zaznaczasz cały
<head> i wklejasz na jego miejsce ten skopiowany z pierwszego pliku
(klasy będą miały takie same nazwy i to jest w tym wszystkim najlepsze)
- zapisujesz i otwierasz następny itd. aż do końca
- nie miałem czasu żeby wyrzeźbić jakiś skrypt, który by to zrobił
automatycznie we wszystkich plikach, ale jakaś wyższa szkoła jazdy to
raczej nie jest
- po zabiegu masz kilka możliwości
1. możesz zaimportować plik html do OOo poprzez "Otwórz plik:"
2. możesz użyć opcji z terminala libreoffice --print-to-file
3. możesz otwierać każdy z tych plików w przeglądarce i wklejać
4. możesz wszystko :)
Post by bzdreg
xml przerasta mój poziom pojmowania abstrakcji tekstu.
Sam (aktualnie) owszem, w Windows, ale wspomniany "redachtór", czyli
moja żona - na Linuxie (skoro dla niej komp miał być tylko maszyną do
pisania i emailowania, to poskąpiłem kasy na Windę).
Niejednokrotnie postęp technologiczny jest następstwem skąpstwa :D
Post by bzdreg
Wniosek na przyszłość tylko taki, że trzeba było zrobić szablony i
rozesłać ludziom z kategorycznymi wytycznymi, zanim zaczną pisać.
Wiem z praktyki, że dużo by to nie dało. Ja do takich zbiorowych prac
używam szablonów z Google Docs.
Post by bzdreg
Swoją drogą - znajomość elementarnych zasad komputerowego redagowania
tekstów wśród adiunktów (bo profesorom, to już można wiele wybaczyć)
jest zatrważająca i powalająca. Po prostu rozpacz.
Zdziwiłbyś się co się dzieje w całej oświacie. Ludzie, którzy mają
przygotować małolatów do funkcjonowania w XXI wieku, nie potrafią odebrać
(o wysyłaniu nawet nie mówię) poczty. Przysięgam, że widziałem poważnego
urzędnika, który liczył na kalkulatorze i kartce, a wyniki wpisywał do
komórek Excela.

Pozdrawiam
Maciek
bzdreg
2012-06-10 17:53:10 UTC
Permalink
Post by MaGorEc
- wchodzisz do katalogu z zapisanymi dokumentami Worda
- odpalasz w nim terminal
- w terminalu wpisujesz: libreoffice --convert-to html --headless *.doc
Rozwaliłeś mnie...
Wiesz... ja wiem, że ja nie wszystko wiem... (aby powiedzieć, że nic nie
wiem, to musiałbym wiedzieć naprawdę dużo...), ale że libreoffice ma
command line interface, to nawet by przez myśl mi nie przeszło...

Chylę czoła, o wielki nauczycielu!

[smoff] Piszesz książki? Jeśli nie, to wymyśl coś dla tych utytułowanych
debili [smon] i napisz, a pomogę Ci to wydać...
--
Dziękuję i pozdrawiam. Bzdreg.
MaGorEc
2012-06-10 21:07:29 UTC
Permalink
Post by bzdreg
- wchodzisz do katalogu z zapisanymi dokumentami Worda - odpalasz w nim
terminal - w terminalu wpisujesz: libreoffice --convert-to html
--headless *.doc
Rozwaliłeś mnie...
Wiesz... ja wiem, że ja nie wszystko wiem... (aby powiedzieć, że nic nie
wiem, to musiałbym wiedzieć naprawdę dużo...), ale że libreoffice ma
command line interface, to nawet by przez myśl mi nie przeszło...
No. Konsola to potęga. A dzięki poleceniom man, help i info możesz się
dużo nauczyć od swojego kompa :) Nie mówiąc o możliwościach związanych z
pisaniem skryptów i _pełnej_ automatyzacji wielu upierdliwych czynności.
Post by bzdreg
Chylę czoła, o wielki nauczycielu!
Już nie taki wielki. Ale spory to ja byłem :D I to byłby temat na książkę.
Post by bzdreg
[smoff] Piszesz książki? Jeśli nie, to wymyśl coś dla tych utytułowanych
debili [smon] i napisz, a pomogę Ci to wydać...
Ostatnio wszyscy za mną łażą żeby im napisać książkę :D Z jednej
propozycji nawet skorzystam chyba :) A utytułowani debile mają to do
siebie, że wiedzą absolutnie wszystko i cała prawda została im objawiona,
ergo: nie wierzą nikomu, kto miałby ochotę zburzyć ich wiarę w
doskonałość własną :) Do pytania o pomoc, czytania i słuchania cudzych
rad trzeba - oprócz dobrych chęci - mieć odrobinę pokory wobec świata. A
tego naszej kaście profesorskiej, w przeważającej większości przypadków,
brakuje ewidentnie.

Pozdrawiam
Maciek

Loading...