recoder: (Default)
[personal profile] recoder

Случилась тут у нас на работе загогулина. В процессе декомпозиции всех наших проектов на микросервисы решили мы воспользоваться шансом и поотпимизировать что можно. В частности - решили поменять JSON парсер, а то он у нас был самодельный, с поддержкой XML и хитрой валидации, но зато несовместимый ни с чем.

Пошли профайлить плюсовые JSON парсеры. Потыкали boost с его свойственными деревьями - оказалось на удивление медленно, причём и в компиляции и в рантайме. Посмотрели на Poco::JSON - более менее фурычит, хотя звёзд с неба и не хватает. Пошли смотреть что ещё бывает в современном мире C++...

А потом по приколу прогнали Python парсер на тех же тестовых данных. И тихо офигели: мерзкий питон уделал наши крутые библиотки в несколько раз. Проверили в разных аспектах - всё верно, питон быстрее плюсов. Даже для эксперимента вызвали из плюсов питоновский парсер - и он всё равно летает.

Как теперь жить с этим знанием? Переписывать всё нафик на Питоне? Таскать везде с собой кусок питона? И самый главный вопрос - как вообще такое могло получиться?!

coding

Date: 2015-08-03 11:51 am (UTC)
From: [identity profile] bash-i-buzuk.livejournal.com
Наворочено не значит быстро :)
А GSON не смотрели? или он только на java?

Date: 2015-08-03 12:56 pm (UTC)
From: [identity profile] sprocket1.livejournal.com
Он не мог как-то дополнительные вычислительные ресурсы задействовать? Многопоточность, например?

Date: 2015-08-03 01:02 pm (UTC)
From: [identity profile] sply.livejournal.com
Если вы не завязаны на посторонних клиентов, то для микросервисов может оказаться удобнее MessagePack (http://msgpack.org) - можно сказать, бинарный аналог JSON. Списки, хэши поддерживает. То есть хоть бинарно, но не такая жестко как в старом RCP.

Date: 2015-08-03 01:07 pm (UTC)
From: [identity profile] zubian.livejournal.com
flex & bison пробовали использовать?

Date: 2015-08-03 02:13 pm (UTC)
From: [identity profile] juan-gandhi.livejournal.com
Тут два вопроса:
- а как это?
- а какая разница, все равно ж на проводах время теряется?

Date: 2015-08-03 02:55 pm (UTC)
From: [identity profile] jdevelop.livejournal.com
а потом окажется, что жабий парсер уделает в несколько раз петоний ;)

Date: 2015-08-03 03:33 pm (UTC)
From: [identity profile] mpak666.livejournal.com
прикольно жеж!
надо вывалить на суд общественности бенчмарки и исходники, авось и объяснения нашлись бы?!

Date: 2015-08-03 03:38 pm (UTC)
From: [identity profile] vtimonin.livejournal.com
https://github.com/miloyip/nativejson-benchmark

Не знаю, как оно там относительно питона, но скорее всего RapidJSON быстрее будет.

Date: 2015-08-03 05:23 pm (UTC)
From: [identity profile] proxfessor.livejournal.com
На ту же тему: читал на днях таблицу из 73000 строк и 55 колонок Питоном (pandas.readcsv) и R (readcsv). Питон прочитал а 7 раз быстрее. Крутое земноводное!

Date: 2015-08-03 05:56 pm (UTC)
From: [identity profile] http://users.livejournal.com/_winnie/
Если питонячий, python-only уделывает C++ - значит, в C++ какой-то ахтунг (лишние malloc, memcpy, неявные O(N^2) и тп).


Вообще вот : http://lionet.livejournal.com/118853.html




December 2024

S M T W T F S
1234567
891011121314
15161718192021
22232425 262728
293031    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 24th, 2026 04:28 pm
Powered by Dreamwidth Studios