Việc xuất hiện các thẻ dư thừa như trong ví dụ của bạn Minh là do bạn đã chọn ngôn ngữ là tiEnglish, thay vì tiếng Việt.
−< br>
−
Cả 2 loại khuôn dạng ODF và OOXML khi được lưu trữ sẽ được nén kiểu ZIP bao gồm nhiều file chứa các định dạng mô tả trang, kiểu và các mô tả khác...
Khi tôi lặp lại ví dụ của bạn Minh thì sự khác nhau giữa tệp ODF và tệp OOXML ở dạng nén là 7,030 bytes và 11,631 bytes. Sau khi giải nén để có thể xem được nội dung của tệp XML thì kích thức tương ứng của tệp content.xml (ODF) là 3,100 bytes và tệp word/document.xml (OOXML) 1,379 bytes. Ở dạng XML, số thẻ của ODF chiếm nhiều không gian hơn OOXML.
Cách tổ chức các tệp phụ trợ của ODF và OOXML là khác nhau do đó kích thước của tệp nội dung và tệp cấu hình trong từng trường hợp không so sánh được.
Như vậy có thể kết luận là phương pháp so sánh của bạn Lê Minh là không chính xác, dựa trên cảm tính.
Tôi đã làm thử 1 trang văn bản 38 câu đầu tiên của Truyện Kiều trên cả 3 khuôn dạng ODF (ODT, nén kiểu zip), OOXML (DOCX, nén kiểu zip) và dạng DOC không nén Winword 97-2003 kích thước lần lượt như sau: ODF - 18,234 bytes, OOXML - 29,586 bytes và DOC Word97-2003 là 99,840 bytes.
Như vậy ý kiến của bạn Minh cho rằng: phải mua bản quyền phần mềm MS Office 2007 và phải tăng dung lượng lưu trữ và xử lý thông tin tiếng Việt lên hàng trăm lần là không đúng. Vì chuẩn mô tả dữ liệu không đồng nghĩa với bản quyền phần mềm tạo ra nó.
Dung lượng lưu trữ và xử lý thông tin tiếng Việt có thể lớn hơn một chút (25-40%) chứ không phải hàng trăm lần. Nếu cần thiết chúng ta phải dùng một phương pháp thống kê.
Chính vì để bảo đảm tính trung thành về khuôn dạng với các phiên bản Office cũ, nên số thẻ mô tả dữ liệu của OOXML lớn hơn ODF. ODF không bảo đảm các file office đã được tạo ra trước đây sẽ giữ được nguyên vẹn về khuôn dạng trình bày. Điều này đặc biệt quan trọng khi ta cần truy cập dữ liệu lưu trữ.
Chuyển sang dùng OOXML, chúng ta được lợi cả 2 khía cạnh:
- Văn bản OOXML có khuôn dạng mở
- Văn bản OOXML chuyển tải trung thành khuôn dạng các văn bản office đã có.
Sau đây là nguyên văn các tệp XML trong ví dụ tôi lặp lại thí nghiệm của bạn Minh:
OOXML: 1,379 bytes
Hội thảo tại Softmart
Và ODF (3,100 bytes).
Thông tin về xử lý ngôn ngữ tiếng Việt không có trong bộ soạn thảo là StarOffice 8, do đó không chọn được
Hội thảo tại Softmart