Что значит формат doc. Форматы документов DOC и DOCX

В старину, когда компьютеры были слабее современных мобильных телефонов, а люди пользовались операционной системой MS DOS, к именам текстовых файлов нередко добавляли расширение doc, подразумевая сокращённое слово «document». Однако в 90-х годах двадцатого века стараниями фирмы Microsoft по всей планете распространился новый вид цифровых документов - файлов с таким же расширением. В общем, речь пойдёт о результатах тех стараний. Ну и, конечно, немножко о форматах...

Как DOC попал в каждый офис

Можно ли заставить мир пользоваться только одним единственным комплектом офисных приложений? Да, и очень просто: достаточно создать закрытый бинарный формат файлов для документооборота, ни с чем не совместимый, кроме текстового процессора Word . Тогда, хочешь или нет, а купишь эту программу (в пакете Microsoft Office), никуда не денешься, ведь без неё ни одной фирме не прожить.

Так формат DOC попал в каждую (без преувеличения) контору, в каждую бухгалтерию, школу, университет, техникум и курсы обучения вышиванию крестиком. И как ни старались разработчики освободить народонаселение от жёсткой привязки к Microsoft Office, что-то получаться начало только с появлением LibreOffice, да и то пока лишь для документов с несложной компоновкой.

Суть в том, что формат DOC - бинарный и закрытый. Поди разбери, каким именно образом документ кодируется в последовательности нулей и единиц и как потом декодируется обратно. Разработчикам, стремившимся постичь суть формата, доводилось действовать, как говорится, по наитию. Потому в ранних версиях OpenOffice.org (предшественника LibreOffice) сложные *doc (с таблицами, рисунками и прочими объектами) нередко отображались довольно криво.

Двадцатого февраля 2008-го года планету облетела новость: международный комитет стандартизации (он же ISO) вынудил Microsoft открыть спецификации форматов Microsoft Office 2007. Однако радость оказалась преждевременной: открыли далеко не всё, оставив множество «белых пятен».

Что такое DOCX

Он же Office Open XML, он же OOXML, является родным братом (почти близнецом) Open Document Format, то бишь, ODF. (В Ubuntu вы, надо полагать, видели файлы с расширением odt, открываемые в OpenOffice.org или LibreOffice).

Формально эти форматы вроде бы разные, но суть одна: zip-архив, внутри которого содержится несколько XML-файлов с размеченным текстом, ну и прочие компоненты.

То есть, бинарный DOC, видимо, страсть как надоел даже самой конторе Microsoft , раз уж они взяли Office Open XML и сделали его форматом Word 2007 по умолчанию. А расширение таким файлам дали docx. Видимо, чтобы привычное «doc» тоже фигурировало и люди документы легко отличали от чего-либо иного.

Однако с признанием DOCX вышла неувязка. Поначалу ISO (комитет стандартизации) воспротивился. Мол, сомневаемся мы, что ваш вариант такой уж совместимый с альтернативным программным обеспечением . Кажется, вы малость схитрили, дабы монополию не терять.

Потом в ISO вроде бы успокоились, но зато возмутились местные комитеты стандартизации сразу в нескольких странах. Таких как Бразилия, Индия, Венесуэла, Дания. Чуть позже к ним присоединились ЮАР, Парагвай и Эквадор. Сказали, мол, не доверяем мы этому DOCX. А заодно и слишком сговорчивому ISO.

Так или иначе, хотя спецификации открыты, формат DOCX является проприетарным. В смысле, запатентованным. Возможность его использования всецело зависит от Microsoft.

Поэтому мир постепенно начал осознавать преимущества вышеупомянутого Open Document Format (того, который ODF). Во-первых, нет никаких патентов, бери и пользуйся как хочешь. Во-вторых, нет подвохов с совместимостью. К ним и переходим.

Менталитет монополиста

Капитализм подразумевает наличие множества небольших фирм. В том числе и таких, где считают каждую копейку. И в конторах разумно сомневаются в целесообразности ощутимых расходов на Microsoft Office . Зачем платить за дорогой софт, если есть свободный LibreOffice.

Вот тут-то, как говорится, шило и вылезло из мешка. Выяснилось, что LibreOffice открывает документы в формате DOCX запросто, а хитрый Word категорически отказывается понимать ODF. Несмотря на то, что DOCX и ODF - чуть ли не близнецы, как сказано ранее.

То есть, Microsoft, не желая распространения бесплатного LibreOffice как альтернативы недешёвому MS Office, препятствует использованию ODF в своих программных продуктах. И, вполне вероятно, делает это намеренно.

Следовательно, хотя Office Open XML существует где-то с 2006-го года, устаревший бинарный DOC выбросить на свалку истории не получается. Ведь ради последующего открытия в Word 2007 и Word 2010 разнообразные файлы, изготавливаемые в LibreOffice, доводится сохранять либо в RTF (небольшие), либо в DOC, увы.

Как с этим жить

В Российской Федерации Open Document Format стал официально узаконенным стандартом. Теперь ни один чиновник государственного учреждения не вправе заявить, мол, присылайте нам документы только в DOC и DOCX, а ваших ODF мы знать не желаем. Значит, путь для массового использования LibreOffice открыт.

В других странах, где законодательство пока иное, можно самостоятельно стремиться сделать Open Document Format популярным стандартом де-факто, не дожидаясь признания де-юре.

Каким образом? Просто использовать LibreOffice и рассказывать об этом бесплатном пакете приложений коллегам, деловым партнёрам, друзьям-приятелям, собеседникам в социальных сетях.

Почему нужно продвигать альтернативу? Вовсе не потому, что ODF чем-то лучше DOCX, они ведь очень похожи. А потому, что привязка всего мира к продукту корпорации-монополиста - это не очень хорошо.

Предыдущие публикации:

Последнее редактирование: 2012-11-03 21:57:20

Метки материала: ,

Начиная с 2007 года обновленная версия Word (и Microsoft Office) для сохранения файлов стала использовать формат DOCX, вместо классического DOC. Это была не просто «экстремальная» версия формата 1990-х годов, дополнительный X в расширении обозначает стандарт Office Open XML.

В чём разница, и какой из них следует использовать? DOC – это формат документа, используемый Microsoft Word, а DOCX – его преемник. Оба являются относительно открытыми, но DOCX более эффективен и создает меньшие, менее повреждаемые файлы.

Если у Вас есть выбор, используйте DOCX, DOC необходим только в том случае, если файл будет использоваться версиями Word до 2007 года.

Краткая история формата DOC

Microsoft Word начал использовать формат DOC и соответствующее расширение файла более 30 лет назад в самом первом выпуске Word для MS-DOS. Word исполнял роль проприетарного процессора документов, формат также был проприетарным: Word был единственной программой, официально поддерживающей файлы DOC, до тех пор, пока Microsoft не откроет спецификацию в 2006 году, после чего она была перепроектирована.

В 90-х и начале 2000-х годов различные конкурирующие продукты могли работать с файлами DOC, хотя некоторые из более экзотических форматов и опций Word не поддерживались в других текстовых процессорах. Поскольку Office и Word были де-факто стандартами для офисных наборов , соответственно, закрытый характер формата файла, несомненно, помог Microsoft сохранить свое господство над такими продуктами, как Corel WordPerfect.

С 2008 года Microsoft несколько раз выпускала и обновляла спецификацию формата DOC для использования в других программах, хотя не все расширенные функции Word поддерживаются открытой документацией.

После 2008 года формат DOC был интегрирован в платные и бесплатные программы обработки текстов многих поставщиков. Это значительно упростило работу с более старыми форматами текстовых процессоров, и многие пользователи по-прежнему предпочитают сохранять документы в старом стандарте DOC.

Введение Office Open XML (DOCX)

Под давлением растущей конкуренции открытого исходного кода и его конкурирующего формата открытых документов (ODF), Microsoft приняла решение о введение открытого стандарта в начале 2000-х годов. Это привело к разработке формата файла DOCX вместе со своими компаньонами, такими как XLSX для электронных таблиц и PPTX для презентаций.

Стандарты были представлены под названием «Office Open XML» (не имеет отношения к программе Open Office), поскольку форматы были основаны на Extensible Markup Language, а не на более раннем и менее эффективном двоичном формате. Этот язык позволил получить несколько преимуществ, в первую очередь, меньшие размеры файлов, меньше шансов на взлом и сжатые изображения.

Формат DOCX на основе XML стал стандартом для Word в версии программного обеспечения 2007 года. В то время многие пользователи полагали, что новый формат DOCX был просто средством для Microsoft поэтапного отказа от более старых версий программного обеспечения и продажи новых копий, поскольку более старые версии Word и Office не могли читать новый XML файлы.

Это было не совсем так: Word 2003 может читать специальные форматы файлов Word XML, а обновления совместимости позднее были применены к другим версиям. Но, в любом случае, некоторые пользователи вручную сохраняли файлы в более раннем стандарте DOC вместо DOCX ради совместимости.

Десять лет спустя DOCX стал новым стандартом де-факто, хотя он не столь универсален, как более старый формат DOC-файлов, благодаря конкурентам, таким как ODF, и общему уменьшению традиционного использования текстового процессора.

Какой из них следует использовать

DOCX – лучший выбор для любой ситуации . Формат создает меньшие, более легкие файлы, которые легче читать и передавать. Открытый характер стандарта Office Open XML означает, что его можно прочитать практически любым полнофункциональным текстовым редактором, включая онлайн-инструменты, такие как Google Docs.

Единственной причиной использования старого формата DOC может быть восстановление некоторых файлов старше десяти лет или работа с очень устаревшим текстовым процессором.

В процессе работы с документами нам часто приходится работать с различного рода форматами документов. В этой небольшой заметке разберем известные форматы, а также каким образом и с помощью каких инструментов пользователь может их открыть.

Формат doc

Файлы с расширением doc являются сокращением от английского document. Microsoft использовала данный формат для файлов текстового процессора Word до 2003 версии включительно. Сегодня doc открыть можно как современным текстовым процессором Word, так и устаревшими версиями. Также doc можно открыть текстовым процессором из бесплатного пакета офисных программ Open Office, либо онлайн сервисами работы с текстовыми файлами такими как Office Online и Google Docs.

Формат docx

Формат doc во многом был неудобен, в работе ввиду своей нестабильности, особенно в плане совместимости с разными версиями Word. В 2007 году вместе с выходом Office 2007 Microsoft сделала основным рабочим форматом для своего текстового процессора Word формат docx, или Open Office XML.

Формат docx является родным форматом для текстового процессора Word начиная с версии 2007, соответственно, открыть docx можно в Word 2007, 2010 или 2013. На самом деле, открыть docx можно и в старой 2000 – 2003й версии Word, однако, для этого придется установить специальное дополнение с сайта Microsoft —пакет обеспечения совместимости .

Пакет обеспечения совместимости позволяет открывать не только файлы формата docx в версиях Word ниже 2007й, но и файлы табличного процессора xlsx в устаревшем табличном процессоре Excel (2000 — 2003), а также формат pptx в устаревшем PowerPoint.

Формат rtf

Это так называемый «формат обогащенного текста» является межплатформенным форматом хранения текста, но в отличие от формата txt, позволяет хранить рисунки в документе. Вопроса «Чем открыть rtf?» не должно возникать, т.к. с ним может работать практически любой текстовый процессор. Например, в Windows системах бесплатный WordPad прекрасно справиться с задачей открытия rtf формата.

Формат txt

Самый простой формат сохранения текста. Его часто ассоциируют с блокнотом в Windows, однако, текстовые файлы может просмотреть даже файловый менеджер. В текстовом файле txt не может быть никаких рисунков или других элементов в принципе.

Формат pdf

Portable Document Format или просто pdf является межплатформенным форматом для электронных документов. Открыть для чтения pdf может бесчисленное множество программ, наверное, самой популярной является Adobe Reader. Начиная с 2013 версии Word может не только сохранять файлы в формате pdf, но открывать для редактирования их. Особенностью данного формата есть то, что напечатанный текст будет в точности таким, каким он представлен в файле pdf. Подробнее о работе с pdf файлами в .

Документы Doc и DocX являются одними из самых распространенных форматов текстовых файлов. Созданные компанией Microsoft, они поддерживаются практически всеми программами, так или иначе работающими с текстами.

DocX был выпущен относительно недавно и главным его плюсом, относительно предшественника Doc, можно назвать меньший размер документа. В названии DocX, X означает Xml.

Однако в чем разница между Doc и DocX форматом, кроме отличий в размере файла? В этой статье мы подробно разберем преимущества каждого и сравним их. Обратите внимание, рассматриваемые форматы не имеют ничего общего с файлами DDOC и ADOC.

В чем разница между Doc и DocX?

Doc
Многие годы назад Microsoft Word использовал Doc в качестве текстового файла по-умолчанию. Этот формат присутствует в операционной системе с первого выпуска пакета Word для MS-DOS.

Вплоть до 2006 года, когда только был запущен Microsoft Word , он являлся проприетарным форматом. То есть являлся частной собственностью компании, которой был разработан, и мог использоваться только оригинальным пакетом приложений. С тех пор многое изменилось и формат Doc может быть открыт большинством сторонних текстовых редакторов.

Doc включен в такие популярные программы обработки текстовых файлов, как LibreOffice Writer, OpenOffice Writer, KingSoft Writer и другие, их список довольно велик.

Полезные статьи


Вы можете использовать данные программы для открытия и редактирования файлов Doc. Не менее популярно интернет приложение Google Поисковика — Google Docs . Оно позволяет не только сохранять написанные документы в Doc формате, но и загружать их на сайт для дальнейшей работы.


DocX
В 2007 году формат Doc вынужденно отходит на второй план, поскольку на сцену выходит новый DocX, созданный Microsoft как преемник устаревшего документа. Он был сделан в связи с растущей конкуренцией между свободными и открытыми форматами, такими как Open Office и ODF .

В DocX весь код был написан в формате Xml. Именно по этой причине к названию старого Doc-файла добавили букву платформы, на которой была создана свежая версия. Новое кодирование соответственно принесло свои изменения и дополнительные возможности в работе.

DocX, являющийся результатом стандартов, представленных под названием Office Open XML, принес такие улучшения, как уменьшение размера файлов. Данное изменение проложило путь компании к разработке форматов PPTX и XLSX.

Форматирование Doc в DocX

В подавляющем большинстве случаев, любое программное обеспечение, работающее с текстами, и которое не может открыть старый формат Doc, способно преобразовать его в DocX. То же самое можно сделать и в обратном направлении.

Данная проблема возникает в случае, если пользователь работает в Word 2003 или более ранних версиях приложения. В этом случае необходимо открыть файл DocX в Word 2007 или более поздней версии и пересохранить его в Doc.

Компания Microsoft всегда стремится к максимальной совместимости своего продукта. Поэтому для старых версий Word был выпущен соответствующий пакет совместимости, который можно установить для поддержки формата DocX.

Если ваш Word все же не поддерживает DocX, а нужен именно он, не стоит отчаиваться! Существуют такие приложения как Google Docs, LibreOffice Writer и ряд других, способных помочь конвертировать любой Doc-файл в DocX, RTF, TXT и т.д.

Какой формат использовать? Doc или DocX?

На самом деле, вопрос “что использовать” касательно Doc и DocX не стоит настолько остро, чтобы он стал делом принципа. Оба этих формата используются одинаково широко всеми программами, так или иначе работающими с текстом.

Тем не менее, DocX лучше, поскольку приводит к существенному уменьшению размеров файла. Такие документы гораздо легче пересылать по почте и открывать для чтения. Еще одним преимуществом DocX является его база — Office Open XML , что позволяет документу поддержание расширенных функций. Многие приложения постепенно отказываются от сохранения документов в формате Doc.

Подводя итоги, принципиальной разницы между форматами нет. Исключением здесь выступает вопрос размера файлов и того, что от поддержания Doc постепенно отказываются разные текстовые программы. Таким образом, рекомендуем переходить на использование DocX, если вы все еще вынуждены работать с Doc.

Как восстановить Doc и DocX файлы?

Потеря важной информации в современном цифровом мире далеко не редкость. Многие из нас сталкивались со случайным стиранием файла путем использования комбинации Shift + Del или, того хуже, сбоем жесткого диска, вследствие чего терялись все документы. Если вы узнаете в этом свою ситуацию, читайте дальше и мы непременно поможем вам вернуть утерянные Doc и DocX файлы!

Приложение Starus Office Recovery 2.6 станет хорошим выбором для любого офисного сотрудника, ежедневно работающего над большим количеством документов, которые крайне важны для его фирмы. Интуитивно понятный русскоязычный интерфейс, высокая производительность и точность сканирования позволят в короткие сроки найти и восстановить удаленные файлы.

Изучить информацию о восстановлении текстовых файлов подробнее вы можете в статье

Doc – это стандартное расширение файлов, созданных текстовым редактором Microsoft Word, начиная с версии 97 и до версии 2003, либо приложением WordPad . Подобные форматы на данный момент фактически устарели.

Версии редактора Word с 2007 года работают с документами, имеющими расширение docx . Соответственно, стандартной программой для открытия файла в старом формате будет версия Word до 2003 года включительно или WordPad, а в новом – Word 2007 или более современный.

Чем отличаются форматы документов

Файлы типа doc – это бинарные (двоичные) файлы, которые могут иметь разное строение , в зависимости от конкретной версии создавшей их программы. Документы, созданные WordPad, отличаются от вордовских в сторону примитивности.

Файл типа docx строится на основе формата Office Open XML . Он отличается от своих предшественников расширенными возможностями восстановления при повреждении. По своей сути это zip-архив текста XML и вспомогательных документов, размещенных в папках. Если открыть primer.docx архиватором 7-zip, то можно увидеть примерно следующее:

Чем открывают расширения doc и docx

А какими еще приложениями можно открывать документы с расширениями doc и docx? Список достаточно большой, но есть некоторые нюансы при их использовании. Корпорация Microsoft традиционно закрывает свои разработки от свободного использования, поэтому сторонние разработчики часто имеют проблемы с совместимостью.


А вот primer.docx с аналогичным содержимым понес некоторые потери – текстовая надпись внизу исчезла . В целом Writer из OpenOffice.org для работы с вордовскими текстами следует применять очень осторожно.



Текстовая надпись потерялась. При попытке редактирования сервис предупреждает , что результат будет сохранен как docx.