ЗАШТО ФОРМАТ "RICH TEXT" ТРАЖИ ТОЛИКО МЕМОРИЈЕ?

Trandaiflko

Aktivan član
Poruka
1.561
Већ је помињан проблем некомпатибилности верзија Worda, када се рецимо залепе речи. Или, текст у тројци кад снимиш у новој верзији, тражи око 15% више простора, као да су слова мало разуђенија, да лакше "дишу". Наравно, то се може решити приликом првог снимања фајла, када подесиш на сompatiblity mode али шта ако то није знао онај ко је рви пут креирао фајл.
Решење: снимај све у RTF фомат.
И, шта се дешава: Снимим неколико фајлова, сви ту око 150 страна, разлика у меморији између верзија docx и RTF код неких врло мала, али код неких баш претерана. Рецимо, у docx има 1,5 МБ чак је и то превише за толики текст без слика, али кад га снимим у RTF оде чак на 12 МБ. Погледам, иста верзија, нисам додавао ништа, исти број речи, "карактера" него само Ворд фајл отворио и снимио у RTF а толика разлика. И то не код свих фајлова.
У чему је цака?
 
Већ је помињан проблем некомпатибилности верзија Worda, када се рецимо залепе речи. Или, текст у тројци кад снимиш у новој верзији, тражи око 15% више простора, као да су слова мало разуђенија, да лакше "дишу". Наравно, то се може решити приликом првог снимања фајла, када подесиш на сompatiblity mode али шта ако то није знао онај ко је рви пут креирао фајл.
Решење: снимај све у RTF фомат.
И, шта се дешава: Снимим неколико фајлова, сви ту око 150 страна, разлика у меморији између верзија docx и RTF код неких врло мала, али код неких баш претерана. Рецимо, у docx има 1,5 МБ чак је и то превише за толики текст без слика, али кад га снимим у RTF оде чак на 12 МБ. Погледам, иста верзија, нисам додавао ништа, исти број речи, "карактера" него само Ворд фајл отворио и снимио у RTF а толика разлика. И то не код свих фајлова.
У чему је цака?
Word ubacuje podakte o formatiranju .docx koji nisu potrebni u .rtf i uvecava ga. Ako sacuvas .docx iz WordPad, .rft bi trebao da bude nesto manji, ali ne znacajno.
 
Ево један од разлога: Радим прелом текста књиге започете давно, у 2003. Ако снимим у 2007 или 2010, од рецимо 5 табака оде на 8.
Човек стално нешто преправља. Док сам био на офис 7 ишло је. Сада, ако отворим у 2010 све у реду док радим, али ако он то негде отвори у седмици, слепише се слова. и све оде у...
То су пипаве ствари, и због прелома страна и посебно заглавље-подножје, све мора у милиметар, па пагинација које не сме бити на празним или насловним странама, итд..
Најчудније кажем, што на неким другим рукописима од такође ту негде око 140-150 страна (А 5 формат) од 600 Кб docx формата, добијем мало више, испод 700 Кб у РТФ, али за неке фајлове, 160 страна рецимо, 10 табака, такође само текст, који је у docx био 1,2 МБ што је много више него docx из седмице, где је било једва 500-600 КБ, и сада од тих 1,2 МБ docx оде на ћак 12 МБ РТФ што је равно ПДФ фајлу до рецимо 30 страна.
И, ако се већ толико разликује седмица од десетке (а тек од каснијих) зашто му нису дали неки други суфикс, рецимо docxх да одмах знам о чему се ради. Јер, пише docx , отворим га у десетки и могу га бацити.
 
Ево један од разлога: Радим прелом текста књиге започете давно, у 2003. Ако снимим у 2007 или 2010, од рецимо 5 табака оде на 8.
Човек стално нешто преправља. Док сам био на офис 7 ишло је. Сада, ако отворим у 2010 све у реду док радим, али ако он то негде отвори у седмици, слепише се слова. и све оде у...
То су пипаве ствари, и због прелома страна и посебно заглавље-подножје, све мора у милиметар, па пагинација које не сме бити на празним или насловним странама, итд..
Најчудније кажем, што на неким другим рукописима од такође ту негде око 140-150 страна (А 5 формат) од 600 Кб docx формата, добијем мало више, испод 700 Кб у РТФ, али за неке фајлове, 160 страна рецимо, 10 табака, такође само текст, који је у docx био 1,2 МБ што је много више него docx из седмице, где је било једва 500-600 КБ, и сада од тих 1,2 МБ docx оде на ћак 12 МБ РТФ што је равно ПДФ фајлу до рецимо 30 страна.
И, ако се већ толико разликује седмица од десетке (а тек од каснијих) зашто му нису дали неки други суфикс, рецимо docxх да одмах знам о чему се ради. Јер, пише docx , отворим га у десетки и могу га бацити.
https://answers.microsoft.com/en-us...ord-2007/2764c5ac-4f7c-4a6d-9419-9e37bddf82d8
Ovde ces naci neke odgovore.
Treba proveriti da li imate sve update-ove i da li neki program ne ometa rad Word-a.

Word 2007, kao default opciju ima "Normal" stil, taj stil dodaje 10 tacki razmaka izmedju redova i medjuprostor je siri za 15%, to je verovatan razlog za produzenje teksta.

Zbog nacina na koji Word radi, mozda je bolje da fino formatiranje uradis tek kada je tekst zavrsen, jer dodavanje jednog reda moze napraviti problem u nastavku. Nije zahvalno.
 
https://answers.microsoft.com/en-us...ord-2007/2764c5ac-4f7c-4a6d-9419-9e37bddf82d8
Ovde ces naci neke odgovore.
Treba proveriti da li imate sve update-ove i da li neki program ne ometa rad Word-a.

Word 2007, kao default opciju ima "Normal" stil, taj stil dodaje 10 tacki razmaka izmedju redova i medjuprostor je siri za 15%, to je verovatan razlog za produzenje teksta.

Zbog nacina na koji Word radi, mozda je bolje da fino formatiranje uradis tek kada je tekst zavrsen, jer dodavanje jednog reda moze napraviti problem u nastavku. Nije zahvalno.
Све је то у реду кад наново снимаш, па провериш овде као на слици. Али, кажем кад добијеш docx фајл, отвориш и нађеш слепљена лова, готова ствар. Отишло у...
Наравно,све радиш у Normal template али џаба.
1612298505975.png

Узми било који фајл куцан у 2003, без обзира што је преправљан у седмици, па упореди густiну слова са десетком, иако су исти сви параmетри на ставци Paragraph. A Онда одеш на други текст куцан десетком, па четком формат паинтер превучеш преко дела теста из тројке и видиш како се слова промешкоље и рашире.
А сви параметри са слике истоветни.
1612298803351.png
 
Све је то у реду кад наново снимаш, па провериш овде као на слици. Али, кажем кад добијеш docx фајл, отвориш и нађеш слепљена лова, готова ствар. Отишло у...
Наравно,све радиш у Normal template али џаба.
Pogledajte prilog 852493

Узми било који фајл куцан у 2003, без обзира што је преправљан у седмици, па упореди густiну слова са десетком, иако су исти сви параmетри на ставци Paragraph. A Онда одеш на други текст куцан десетком, па четком формат паинтер превучеш преко дела теста из тројке и видиш како се слова промешкоље и рашире.
А сви параметри са слике истоветни.
Pogledajte prilog 852496
Korupcija dokumenta moze da se desi i na drugom kompjuteru, obe strane moraju proveriti update-ove. Office je osetljiv, nije napravljen za veliku preciznost i stabilnost, to ne mozes promeniti.
Cuvaj kopije ranijih verzija, tako da uvek imas barem jednu ispravnu ili/i neka izmene salje u posebnom dokumentu, ako je problem uvek sa istom osobom, onda mozes sam uneti izmene u dokument, zavisi koliko su obimne izmene.

Nisam koristio 2003.
Ne razumem zasto bi 2010. povecavao razmak izmedju redova, obe verzije koriste velicinu stranice i apsolutne mere kao parametre.
Mozda se na ekranu vidi nesto drugacije, ali je u stampi isto?
 
Korupcija dokumenta moze da se desi i na drugom kompjuteru, obe strane moraju proveriti update-ove. Office je osetljiv, nije napravljen za veliku preciznost i stabilnost, to ne mozes promeniti.
Cuvaj kopije ranijih verzija, tako da uvek imas barem jednu ispravnu ili/i neka izmene salje u posebnom dokumentu, ako je problem uvek sa istom osobom, onda mozes sam uneti izmene u dokument, zavisi koliko su obimne izmene.

Nisam koristio 2003.
Ne razumem zasto bi 2010. povecavao razmak izmedju redova, obe verzije koriste velicinu stranice i apsolutne mere kao parametre.
Mozda se na ekranu vidi nesto drugacije, ali je u stampi isto?
Другачија унутрашња конфигурација текста. Кажем рукопис од 12 табака рађан и допуњаван у 2003, снимим у седмици и добије, уместо 192 стране,,сада 224. И онда упоређујем страну по стран, маргине исте, али већ од првих редова видиш да сада треба више простора. не мислим о прореду између редова, него између слова иако су исти параметри ан стави Paragaph, постављао сам слику.
 
Другачија унутрашња конфигурација текста. Кажем рукопис од 12 табака рађан и допуњаван у 2003, снимим у седмици и добије, уместо 192 стране,,сада 224. И онда упоређујем страну по стран, маргине исте, али већ од првих редова видиш да сада треба више простора. не мислим о прореду између редова, него између слова иако су исти параметри ан стави Paragaph, постављао сам слику.
Razmak izmedju slova kontrolise font dijalog, drugi tab.

Koliko je meni poznato, od 2007. koriste drugaciji nacin rasporedjivanja reci u redu, uglavnom manipulisuci prostorom izmedju reci, kako bi se postigla bolja rasirenost reci upotrebom "justify" opcije, ali koliko mi je poznato nisu menjali samu strukturu fonta, jer bi font trebao da bude standardizovan, velicina, oblik, razmak izmedju slova i ostalo.

E sad, najveca razlika je izmedju 2003 i 2007, bolje bi bilo izbeci konverziju izmedju njih, ako je moguce.

Ovde imas razilike izmedju 2003, 2007 i 2010
https://support.microsoft.com/en-us...versions-cb713c85-3145-4e83-a8b6-1e3227a4c059
 
Razmak izmedju slova kontrolise font dijalog, drugi tab.
Јбг, колико пута да поновим да су исти параметри paragagršah, Font итд
Тражи више простора чак и када није justify опција. рецимо када радим књигу поезије, ту увек иде лево поравнање, ли централно, никада justify
Уосталом, када радим прозни текст, користим Hyphenisation
И понављам, највећи је проблем када добијеш текст у docx формату, значи није 2003 али гатај да ли је седмица или касније. А код једног човека видех, имао верзију 2016 и када се отвори у десетки, исти случај. Требало је да дају неку ектсензију да одмах знаш која је верзија јер се за сада разликују само 2003 која је doc а остале све у исти казан.
 
Baš zbog ovoga što je Microsoft često nekompatibilan sa samim sobom, volim da radim sa većim tekstovima u običnom tekst formatu (*.txt, koristim Notepad++) a da formatiranje radim na kraju (mada više i ne koristim M$Office, prešaltao sam se na Libre Office u potpunosti).
Е баш бих волео да видим како то изгледа, све у Нотпад па онда формат. И имаш рецимо 200 страна и едом где ћеш италик, где болд, где нови ред...
Што мора просто...
на крају крајева, није ни битно толико што РТФ направи већи фајл, чисто сам то навео што ме чуди више него што ми смета.
 
Евo нешто испрабах: један рукопис од само 90 страна, има унутра 6 сличица, мањих, без неке резолуције, једва пар десетина КБ, сниман екран уз помоћ Fast Stone capture али снимљено у седмици, 3,8 МБ. Снимим га у десети, мало мањи, 3,7 М.
И замислите, када га снимим у ПДФ, свега 1,8 МБ, 2,5 пута мање.
И онда тај фајл од 3,8 МБ снимим у РТФ и оде на целих 38 МБ. Замислите!
Из сваке верзије, када га снимим као ПДФ, ту око 1,8 МБ.
И то ми није јасно, како је ПДФ 2,1 пута мањи него Ворд, а чак 21 пут мањи него РТФ. .
 
Е баш бих волео да видим како то изгледа, све у Нотпад па онда формат. И имаш рецимо 200 страна и едом где ћеш италик, где болд, где нови ред...
Што мора просто...
на крају крајева, није ни битно толико што РТФ направи већи фајл, чисто сам то навео што ме чуди више него што ми смета.
Da ti pojasnim: dok kucaš tekst, skoncentrisan si na tekst.
Notepad++ je malo napredniji tekst editor od običnog Microsoftovog Notepad-a (ima ih još, ali ++ je besplatan, kao i PSPad) i ima između ostalog i spellcheck (pa čak i za srpski jezik). Dakle, možeš dobar deo posla da završiš na samom tekstu dok ga kucaš (zna i on da podvlači pogrešno otkucano kao i Word).
Kada završiš sa tekstom, preneseš ga u Word i onda se više ne baviš tekstom. To si sredio. Počinješ da se baviš formatiranjem i tu nastupa magija:
Ovde imas odgovor
https://forum.aspose.com/t/serious-...ds-creating-crazily-bloated-rtf-files/43976/6

Problem je kako .rtf funkcionise i cuva formatiranje.
.docx koristi stilove i na jednom mestu cuva formatiranje za ceo dokument
.rtf cuva formatiranje za svaki paragraf pojedinacno, sto dovodi do ogromnog uvecanja dokumenta. Izgleda da sto je vise direktnog formatiranja, to je veci fajl.
Stilovi u Word-u služe za formatiranje izgleda pasusa (pasus je inače osnovna jedinica preloma teksta).
Svaki naslov treba da dobije jedan od Heading stilova (1-9, ako se ne varam). Svaki stil se može izmeniti da izgleda upravo onako kako zamislimo, i onda svaki pasus koji hoćeš da izgleda na određeni način, selektuješ (trostruki klik) i klikneš na stil koji ti treba, taj pasus se odmah izmeni kako treba.
Stilove naslova je obavezno koristiti jer se koriste i kao vrsta bukmarka, a i za izradu TOC (table of content ili ti na srpskom SADRŽAJ). To se ne radi ručno, tipa naslov tačka, tačka, tačka, tačka, tačka, tačka, tačka, tačka, tačka, tačka, strana 15, nego se TOC kreira automatski zahvaljujući Heading stilovima do željenog nivoa dubine.

Itd...
 
Евo нешто испрабах: један рукопис од само 90 страна, има унутра 6 сличица, мањих, без неке резолуције, једва пар десетина КБ, сниман екран уз помоћ Fast Stone capture али снимљено у седмици, 3,8 МБ. Снимим га у десети, мало мањи, 3,7 М.
И замислите, када га снимим у ПДФ, свега 1,8 МБ, 2,5 пута мање.
И онда тај фајл од 3,8 МБ снимим у РТФ и оде на целих 38 МБ. Замислите!
Из сваке верзије, када га снимим као ПДФ, ту око 1,8 МБ.
И то ми није јасно, како је ПДФ 2,1 пута мањи него Ворд, а чак 21 пут мањи него РТФ. .
A zašto iz Worda snimaš u PDF, pa iz PDF u RTF, kad valjda možeš direktno iz Worda da snimiš RTF, a PDF je konačni format kojeg daješ na štampanje?
 
A zašto iz Worda snimaš u PDF, pa iz PDF u RTF, kad valjda možeš direktno iz Worda da snimiš RTF, a PDF je konačni format kojeg daješ na štampanje?
Хајде да одговорим на оба коментара: На други, от што написах, снимао сам само провере ради, колика је меморија да упоредим. Наравно, на крају целе приче, финални производ који иде штампару је ПДФ. Такође, ако нешто откуцам и шаљем у неку копирницу да штампају (немам принтер) шаљем у ПДФ да не би њима Ворд нешто расуо и пореметио.
*
Први коментар:
Јесте, стилови су важни, посебно за поезију, где малене на свакој страни имаш наслов, док је код прозе наравно другачије.
За обичне књиге је довољно Хединг 1 и 2, мада имаш и оних где има неколико нивоа: наслов секције, поглавље, под поглавља, оно степенасто..
Ја сам склонио са менија све од Хединг 3 надаље, а он ми после сакрио и Хединг 2.
Ворд нешто воли фонт Camrbria стално га форсира за наслове и поднаслове, па ајд да му се не противим лепа су слова.
Често се реси кад неко не зна да Table of contents заправо није текст као текст, него збир линкова наслова у књизи. И, ако хоћеш нешто да мењаш у наслову, мењаш тамо а не у Садржају. Колико сам књига видео где у Садржају уместо некe ставке пише Bookmark has not been deifined. Неко је нешто мењао у самом Садржају и пореметио везу.
Био сам научио и Table of figures као и Тable of Authorities, али кад га не користиш, заборавиш. А ово друго се не исплати радити у словенским језицима, због падежа. Јер, ако хоћеш да ти пронађе на којим странама се помиње рецимо Платон, може, али не и за Платона у падежима. Можеш и то да сетујеш, али док то урадиш наново команду за све падеже, скупља пита од тепсије Лакше ићи на FInd па прибележити стране.
Такође, никад нисам користио Крос референсе. Исти разлог- никад ми нису требале. Кад неко ради семинар, докторат, па му списак литературе има неколико страна, то му треба, а овако јок. А гледао сам неке радов, студије итд од рецимо 8'страна а Референсе десетак. Па човече, је ли ишта твоје или си само био ресавац па препицвао?
То је као ACCESS DATABASE. У склопу полагања за ЕЦДЛ морао сам да га добро савладам, и збиља је добар, естетски супер, али ево 19 година од полагања, никад ми није затребао, и заборавио сам га. Сви раде у Екселу, па још кад га подупру ВБ-ом...
 
Рекох ти да сам то радио само а упоредим меморију. ПДФ је на крају приче, кад иде штампару.
А РТФ само када радим са различитим верзијама, рецимо средим некоме текст и шаљем му у РТФ ако знам да је на седмици, д аби било компатибилно.
 
Ворд нешто воли фонт Camrbria стално га форсира за наслове и поднаслове, па ајд да му се не противим лепа су слова.
Jedno je šta je podrazumevani font, a drugo šta ti odlučiš da bude podrazumevani font. Izmeniš font u stilu naslova, i ode Cambria u penziju.
Drugo, meni su važniji fontovi i stilovi kod dugačkih tekstova (proze), jer čitanje toga traje malo duže i ako mi se ne sviđa kako izgleda (previše zbijeno ili previše razvučeno i sl.) onda je prilično zamorno.
Јер, ако хоћеш да ти пронађе на којим странама се помиње рецимо Платон, може, али не и за Платона у падежима.
Može ako u pretrazi ne tražiš cele reči (whole words). Ako tražiš cele reči, na "Platon" naći će samo "Platon", ako ne tražiš cele reči, onda će ga naći u svim oblicima.
Често се реси кад неко не зна да Table of contents заправо није текст као текст, него збир линкова наслова у књизи. И, ако хоћеш нешто да мењаш у наслову, мењаш тамо а не у Садржају. Колико сам књига видео где у Садржају уместо некe ставке пише Bookmark has not been deifined. Неко је нешто мењао у самом Садржају и пореметио везу.
E upravo zbog ovakvih stvari i odvajam kucanje teksta i formatiranje teksta.

Kod mene proces ide ovako:

Notepad++
  • Kucanje teksta
Naslov
Tekst u pasusima blablabla...
Naslov
Tekst...

  • Provera, ispravke
Onda sređen tekst ide u Libre Office Writer (ili Word, mada njega više ne koristim) i onda ceo tekst dobije stil "normal" (koji sam podesio kako mi odgovara), zatim selektujem naslove i određujem im Heading stilove, ako negde u tekstu treba nešto boldovati ili iskriviti, sada je već mnogo preglednije da se nađe, a može i da se pretražuje i to sve ide mnogo brže nego da o formatiranju razmišljam dok još razmišljam i o tekstu.
 

Back
Top