(fwd) Re: [apache-talk] xml vs rtf

Andrey Gerzhov (kittle@freeland.kiev.ua)
Tue, 26 Oct 1999 23:59:53 +0300 (EEST)

-- forwarded message --
Path: freeland.kiev.ua!news.alexradio.kiev.ua!not-for-mail
Date: Tue, 26 Oct 1999 16:10:42 +0400 (MSD)
From: Victor Wagner <vitus@ice.ru>
To: apache-talk@lists.lexa.ru
Subject: Re: [apache-talk] xml vs rtf
Message-ID: <Pine.LNX.4.10L0.9910261602330.10109-100000@zinc.fe.msk.ru>
Newsgroups: alex.gated.apache.talk
Lines: 71
Xref: freeland.kiev.ua alex.gated.apache.talk:1801

On Tue, 26 Oct 1999, Serge Shikov wrote:

> > Ну, неточно выразился. XML по Word-овой DTD. (если, конечно, _этот_
> > стандарт Microsoft будет соблюдать)
> А, ну это пофиг. Главное чтобы сам DTD был в пределах досягаемости. А
> потом такого тоже быть IMHO не может - либо Ворд будет уметь XML вообще
> (а значит - любой DTD, какой _я_ захочу), либо это значит, что он не
> будет его уметь вообще.

Насколько я понял, они собираются некую DTD использовать в качестве
формата для сохранения файла по умолчанию. Что дало бы оптимальный для
пользователей вариант. Только вот боюсь что это опять будет XML с
proprietary расширениями.

> > > прайсы, которые турфирма готовит в Excel. И с которыми после
> >
> > На http://arturo.directmail.org/filtersweb был?
> Был. Пока собрать не смог, но в процессе.

Подо что? У меня собрался без проблем на Linux/glibc.

> > Мне лично тот XML, который генерирует эта xls2xml не понравился. Например,
> > потому что сломался на первом же файле с формулами, который я ему
> > подсунул.
> Мда...
> > Посему я продолжаю развивать свой xls2csv, который не пытается
> > декомпилировать формулы, и использует существенно более простой выходной
> > формат.
> Формулы мне кстати нафиг не нужны. Можно считать, что их нету и не
> будет.

Самое главное, что при парсинге формулы оно игнорирует текущее посчитанное
значение. И пишет только формулу, считай мол сам. А вместо формулы
написано [Formula Error].

Так что бери мой xls2csv и приделывай к нему свой xml-ный бэкэнд.
Благо у меня существует момент, когда рабочий лист хранится в памяти
как массив указателей на массивы указателей на строки (там чуточку сложнее
чем **char[], поскольку надо аллокацией управлять. При этом все строки
уже преобразованы в текущую локальную кодировку.


> > А реляционная база не проще будет?
> Не, не проще. Там структура данных далеко не такая простая, многомерные
> таблицы. Ее только отображать в реляционную базу замучаешься. И
Это-то как раз легко. Может быть непривычно, но...

> А тож. Но поскольку на сегодня этот процесс весьма сложен и трудоемок,
> пообещав упрощение, добиться от исполнителей можно чего угодно ;-)

Самое надежное - save as csv от них добиться ;-)
> извлекаться из нее. Например на уровне Курорт->Отель будет база, а
> внутри цены на номера будут в виде одного XML-документа, сложной
> древовидной структуры.

которая очень просто пихается во всяком случае в некоторые базы.
Вот в Oracle тебе для этого есть и CONNECT BY/START WITH и nested tables.
Хотя я из некоторого пуризма (соображений переносимости) предпочитаю без
них обходиться.

--------------------------------------------------
Victor Wagner vitus@ice.ru
Programmer Office:7-(095)-203-51-19
Institute for Commerce Home: 7-(095)-135-46-61
Engineering http://www.ice.ru/~vitus

=============================================================================
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =

-- end of forwarded message --

-- 
С тем, что не помешает никогда,
                                               Kittle