created test

Change-Id: Ia47900718c8a37a711fa02b68d700375a49f05ba
diff --git a/__pycache__/bunc2tei.cpython-310.pyc b/__pycache__/bunc2tei.cpython-310.pyc
new file mode 100644
index 0000000..3126919
--- /dev/null
+++ b/__pycache__/bunc2tei.cpython-310.pyc
Binary files differ
diff --git a/__pycache__/bunc2tei_test.cpython-310-pytest-7.2.2.pyc b/__pycache__/bunc2tei_test.cpython-310-pytest-7.2.2.pyc
new file mode 100644
index 0000000..fc914e3
--- /dev/null
+++ b/__pycache__/bunc2tei_test.cpython-310-pytest-7.2.2.pyc
Binary files differ
diff --git a/__pycache__/test_bunc2tei.cpython-310-pytest-7.2.2.pyc b/__pycache__/test_bunc2tei.cpython-310-pytest-7.2.2.pyc
new file mode 100644
index 0000000..5adbf09
--- /dev/null
+++ b/__pycache__/test_bunc2tei.cpython-310-pytest-7.2.2.pyc
Binary files differ
diff --git a/bunc2tei.py b/bunc2tei.py
index c142567..830e715 100644
--- a/bunc2tei.py
+++ b/bunc2tei.py
@@ -36,7 +36,7 @@
         data[i] = {}
         data[i]['title'] = text.get('title')
         data[i]['url'] = text.get('url')
-        data[i]['author'] = text.get('author')
+        data[i]['author'] = text.get('author') 
         data[i]['date'] = text.get('date').split(' ')[0]
         data[i]['time'] = text.get('date').split(' ')[1]
 
diff --git a/sample.xml b/sample.xml
new file mode 100644
index 0000000..bf5dbb5
--- /dev/null
+++ b/sample.xml
@@ -0,0 +1,120 @@
+<?xml version="1.0" encoding="utf-8" standalone="no"?>
+<TEI xmlns="http://www.tei-c.org/ns/1.0" xml:lang="bg">
+<text xml:lang="bg" source="dnevnik.bg" date="2020-01-01 10:41" url="https://www.dnevnik.bg/detski_dnevnik/zdrave/2020/01/01/4011288_nai-efektivnite_metodi_za_spraviane_s_mahmurluka/" title="Най-ефективните методи за справяне с махмурлука" subtitle="" author="Дневник" category="">
+    <body>
+      <div>
+        <div>
+          <div type="metadata">
+            <div type="title">Най-ефективните методи за справяне с махмурлука</div>
+            <div type="domain">dnevnik.bg</div>
+            <div type="pageURL">https://www.dnevnik.bg/detski_dnevnik/zdrave/2020/01/01/4011288_nai-efektivnite_metodi_za_spraviane_s_mahmurluka/</div>
+            <div type="id">4011288</div>
+            <div type="mainImageURL">https://www.dnevnik.bg/shimg/zx860y484_4011287.jpg</div>
+            <div type="mainImageSource">Reuters</div>
+            <div type="mainImageWidth">860</div>
+            <div type="mainImageHeight">484</div>
+            <div type="authors">Дневник</div>
+            <div type="authorURLs">https://www.dnevnik.bg/author/337</div>
+            <div type="tags">махмурлук, здраве, алкохол</div>
+            <div type="datePublished">2020-01-01</div>
+            <div type="timePublished">10:41</div>
+            <div type="numberOfViews">19325</div>
+            <div type="numberOfComments">52</div>
+          </div>
+<p>Посрещането на Нова година неизменно е съпътствано от вдигане на наздравици. Нерядко обаче обърнатите питиета идват в повече на празнуващите. Срещу досадния махмурлук експерти от Abacus Foods, цитирани от в. "Дейли експрес", препоръчват няколко бързи и лесни средства за справяне с последиците от прекаляването с алкохол, предава БТА.</p>
+<p>Състоянието, известно като махмурлук, е резултат от обезводняване, причинено от прекомерна употреба на алкохол. Прекаляването с напитките може да доведе и до електролитен дисбаланс, който според някои проучвания играе скромна роля в това колко е лош махмурлукът. Как най-бързо и лесно да се справим с последиците от обръщането на повече чашки, без да ни се налага да посягаме към аспирина?</p>
+<p>Течности</p>
+<p>За успешно справяне с махмурлука е изключително важно да се приемат повече течности, по възможност съдържащи електролити - минерална вода, кокосова вода, спортни напитки .</p>
+<p>Сън</p>
+<p>Сънят остава едно от най-добрите възстановителни средства. Докато човек спи, органите му получават възможността да "отдъхнат" и да се възстановят. При махмурлук черният дроб се труди здраво, за да разгради алкохола, и сънят подпомага естественото му изцеление.</p>
+<p>Джинджифил</p>
+<p>Джинджифилът е отлично средство срещу съпътстващите махмурлука гадене и повръщане. За целта експертите препоръчват чай с парченце пресен джинджифил.</p>
+<p>Потене</p>
+<p>Изпотяването чрез тренировка или гореща вана помага на лимфната система да се освободи от токсините в тялото. Бъдете внимателни със сауната обаче, тъй като прекомерното потене може да ви обезводни още повече и да понижи кръвното налягане.</p>
+<p>Мазна храна</p>
+<p>Ако сте решили да обърнете някое и друго питие, е оправдано преди това да си "подложите" с мазна пица или пържени картофи. Допълнителните мазнини в червата помагат да се забави усвояването на алкохола. Експертите напомнят също, че не е добре да се пие на празен стомах.</p>
+<p>Фруктоза</p>
+<p>Фруктозата съдейства да се ускори метаболизмът на алкохола. За да си я набавите, хапвайте плодове, препоръчват специалистите.</p>
+<p>И тайната на разузнавачите</p>
+<p>Междувременно хомеопатът и доктор на биологическите науки Михаил Лущик разкри в интервю пред радио Sputnik средство, което помага да се понижи степента на въздействие на алкохола. "Мога да посъветвам едно лекарство - това е натриев тиосулфат. Разузнавачите използват това средство, за да не се напият. Той премахва ефекта на алкохола върху тялото, или по-скоро абсорбира алкохола. Съветвам всички да се запасят с това лекарство преди новогодишните празници", заяви Лущик, цитиран от агенция "Фокус".</p>
+<p>Той поясни, че натриевият тиосулфат се използва от лекарите за лечение на алкохолизъм, а в малки дози това лекарство се счита за ефективно средство за алкохолна интоксикация. "Трябва да се помни, че натриевият тиосулфат не се комбинира с всички лекарства - списъкът е в инструкциите. Това вещество има и редица странични ефекти - например, ако прекалите с дозировката, тогава диарията и гаденето са гарантирани", предупреждава Лущик.</p>
+        </div>
+      </div>
+    </body>
+  </text>
+<text xml:lang="bg" source="dnevnik.bg" date="2020-01-01 12:07" url="https://www.dnevnik.bg/skorost/2020/01/01/4011314_policiiata_registrira_niakolko_katastrofi_s_piiani/" title="Полицията регистрира няколко катастрофи с пияни шофьори в новогодишната нощ" subtitle="" author="Георги Пауновски" category="">
+    <body>
+      <div>
+        <div>
+          <div type="metadata">
+            <div type="title">Полицията регистрира няколко катастрофи с пияни шофьори в новогодишната нощ</div>
+            <div type="domain">dnevnik.bg</div>
+            <div type="pageURL">https://www.dnevnik.bg/skorost/2020/01/01/4011314_policiiata_registrira_niakolko_katastrofi_s_piiani/</div>
+            <div type="id">4011314</div>
+            <div type="mainImageURL">https://www.dnevnik.bg/shimg/zx860y484_4011313.jpg</div>
+            <div type="mainImageSource">Велко Ангелов</div>
+            <div type="mainImageWidth">860</div>
+            <div type="mainImageHeight">484</div>
+            <div type="authors">Георги Пауновски</div>
+            <div type="authorURLs">https://www.dnevnik.bg/author/29</div>
+            <div type="tags">пияни шофьори, катастрофи, пътна полиция</div>
+            <div type="datePublished">2020-01-01</div>
+            <div type="timePublished">12:07</div>
+            <div type="numberOfViews">5402</div>
+            <div type="numberOfComments">16</div>
+          </div>
+<p>Няма загинали при катастрофи в новогодишната нощ, но пешеходец е пострадал на бул. "Цариградско шосе", каза днес инспектор Лъчезар Близнаков от отдел "Пътна полиция" към Главна дирекция "Национална полиция", цитиран от агенция "Фокус". Регистрирани са две катастрофи с участието на пияни водачи.</p>
+<p>На територията на община Хисаря водач на 23 години с 1.82 концентрация алкохол в кръвта се е преобърнал край пътя. В Хасково също е станало едно произшествие с водач, който е карал с 1.72 промила.</p>
+<p>Според "Нова телевизия" при катастрофата в Хасково са пострадали петима души, сред които и бременна жена. Ударът е станал малко след полунощ между три автомобила на централно кръстовище.</p>
+<p>След спречкване в столично заведение около 6 часа сутринта афектиран шофьор подкарал автомобила си и ударил двама човека от охраната и още четирима гости на заведението. Всички са настанени в болница, а водачът е бил употребил алкохол.</p>
+<p>Инспектор Близнаков посочи, че липсват сигнали от граждани за шофьори, седнали зад волана пили. "Всички водачи, които сядат пили, са пили с някого. Как могат да стоят хората безучастни и да позволяват на някого да се качи в колата и да управлява?", коментира той.</p>
+<p>Вчера и през нощта са констатирани над 50 водачи, употребили алкохол, посочи инспекторът. От началото на коледните празници пътна полиция е регистрирала над 38 хил нарушения, свързани основно с превишена скорост.</p>
+<p>"На водачите на МПС са наложени над 2300 принудителни административни мерки", каза той и уточни, че в това число има и отнети свидетелства за управление и спрени от движения МПС.</p>
+        </div>
+      </div>
+    </body>
+  </text>
+<text xml:lang="bg" source="dnevnik.bg" date="2020-01-01 07:33" url="https://www.dnevnik.bg/bulgaria/2020/01/01/4007490_kakvo_vliza_v_sila_ot_1_ianuari_2020_g/" title="Какво влиза в сила от 1 януари 2020 г." subtitle="" author="Елена Геловска" category="">
+    <body>
+      <div>
+        <div>
+          <div type="metadata">
+            <div type="title">Какво влиза в сила от 1 януари 2020 г.</div>
+            <div type="domain">dnevnik.bg</div>
+            <div type="pageURL">https://www.dnevnik.bg/bulgaria/2020/01/01/4007490_kakvo_vliza_v_sila_ot_1_ianuari_2020_g/</div>
+            <div type="id">4007490</div>
+            <div type="mainImageURL">https://www.dnevnik.bg/shimg/zx860y484_4008131.jpg</div>
+            <div type="mainImageSource">Дневник</div>
+            <div type="mainImageWidth">860</div>
+            <div type="mainImageHeight">484</div>
+            <div type="authors">Елена Геловска</div>
+            <div type="authorURLs">https://www.dnevnik.bg/author/46</div>
+            <div type="tags">1 януари, януари, поръчки, Столична община</div>
+            <div type="datePublished">2020-01-01</div>
+            <div type="timePublished">07:33</div>
+            <div type="numberOfViews">45072</div>
+            <div type="numberOfComments">64</div>
+          </div>
+<p>Промени в условията за пенсиониране, нов размер на минималната заплата и ръст на учителските възнаграждения, по-високи местни данъци в някои общини. Това са някои от новостите в законодателството, които влизат в сила днес.Доходи и осигуряване</p>
+<p>Размерът на минималната работна заплата за страната (МРЗ) се увеличава с 8.9% и става 610 лв. Едновременно с това нараства и приравненият към нея минимален месечен размер на осигурителния доход за самоосигуряващите се - също 610 лв. Запазва се максималния месечен размер на осигурителния доход на 3000 лв.</p>
+<p>Минималните заплати на учителите ще бъдат увеличени с 18% от 1 януари 2020 г. Това предвиждат промени в наредба от 2017 г. за нормиране и заплащане на труда, предложени от Министерството на образованието. Предвижда се минималната заплата на педагогическите специалисти (учители, възпитатели, логопеди, психолози, педагогически съветници и др.) да стане 1085 от 1 януари при сегашни 920 лева. За старшите учители и старши възпитатели е предвидено минимално възнаграждение в размер на 1120 лева, а за главен учител или възпитател - 1176 лева.</p>
+<p>Увеличава се минималният месечен размер на осигурителния доход за регистрираните земеделски стопани и тютюнопроизводители от 400 лв. на 420 лв.</p>
+<p>Увеличава се и минималният осигурителен доход по икономически дейности и професии - средно с около 5.4%.</p>
+<p>За дните в неплатен отпуск дължимата здравна осигуровка се изчислява върху 305 лв, а не 280 лв., колкото беше миналата година. Всички, които внасят здравни осигуровки за своя сметка (например трайно безработните и абитуриентите в месеците преди да започнат работа или да се запишат в университет), дължат месечно по 24.40 лв. на здравната каса.</p>
+<p>Увеличава се изискваната възраст за пенсиониране и осигурителен стаж. Мъжете занапред ще се пенсионират при навършени 64 г. и 3 месеца, с един месец по-късно от миналата година, а изискването за стаж за тях нараства с 2 месеца до 38 г. и 10 м. За жените увеличението и на възрастта и на стажа е с по 2 месеца до съответно 61 г. и 6 м. и 35 г. и 10 м. Очаква се благодарение на това броят на пенсионерите да намалее до около 2.137 млн. души.</p>
+<p>- Столичната община преминава изцяло на електронни поръчки . т 1 януари Столична община минава изцяло към електронни поръчки. Това каза кметът на София Йорданка Фандъкова във връзка със стратегията за дигиталната трансформация на София на Столичната община, предаде "Фокус". Нови цени</p>
+<p>С решение на Комисията за енергийно и водно регулиране са коригирани цените на ВиК услугите на операторите в 24 области на страната.</p>
+<p>В София кубик вода вече струва 2.76 лева, което представлява увеличение със 7 на сто. Най-голямо е увеличението в Кърджали - с 9.7% до 2.61 лева за кубик, а най-малко е повишението в Пловдив - с 0.5% до 2.22 лв. за един кубик вода.</p>
+<p>Шумен остава сред градовете с най-скъпа вода. Досега за кубик вода шуменци плащаха по 3.40 лв., а занапред 3.54 лв.</p>
+<p>Във Варна водата струва 3.21 лв., в Русе - 3.15 лв., в Бургас - 3.08 лв., в Ямбол - 3.03 лв., във Враца - 3.27 лв., в Добрич - 3.45 лв., във Видин - 2.54 лв., в Габрово - 2.71 лв., в Плевен - 2.88 лв., в Благоевград - 2.35 лв., в Стара Загора - 3.01 лв., в Ловеч - 3.16 лв.</p>
+<p>Перничани също ще плащат по-скъпа вода въпреки водния режим в града - по 2.42 лева за кубик вода (повишение с 3.7%).</p>
+<p>Намаление на цената на водата ще има само в Разград - понижение с 5% до 3.67 лв. за един кубик.Нови данъци в София</p>
+<p>Вдига се годишният данък за колите, регистрирани в София , съобразно техния евростандарт и мощност с изключение на колите със стандарт Евро 5 и 6. За Евро 3 увеличението на коефициента е от 1 на 1.1. За Евро 4 той от 0.8 става 1.0, което ще вдигне данъка им със 17 лева. За колите без категория и с Евро 1 и 2 увеличението е най-голямо - от 1.1 на 1.4. Това е повишение от 40 лева.</p>
+<p>По показателя мощност на двигателя най-голямото увеличение е за колите с най-много конски сили - за над 328 к.с. (над 245 киловата) коефициентът, по който се формира размера на данъка досега е 2.1 и става 2.42. За коли между 201 и 328 к.с. (150 - 245 киловата) коефициентът от 1.6 става 1.84. За коли с мощност 147 - 201 к.с. (110 - 150 киловата) - от 1.23 скача на 1.42. За коли с мощност от 99 - 147 к.с. (74 - 110 киловата) - от 1.1 на 1.21. За коли с мощност 74 - 99 к.с. (55 - 74 киловата) остава сегашният компонент 0.54. За най-ниската мощност - под 74 к.с. (до 55 киловата) също компонентът от 0.34 остава.</p>
+<p>В парично изражение увеличението за колите с най-ниски екостандарти увеличението ще е от 3 до 10 лева, а за тези с мощност до 100 к.с., които са най-масовите в София, то е ще е между 7 и 40 лева.</p>
+<p>От 1 януари се повишава данъкът върху всички сделки с имоти и коли, който от 2.5% става на 3% от цената на продажбата или от данъчната оценка. Данъкът се начислява върху по-високата сума от двете.</p>
+        </div>
+      </div>
+    </body>
+  </text>
+</TEI>
diff --git a/test_bunc2tei.py b/test_bunc2tei.py
new file mode 100644
index 0000000..55d9b0d
--- /dev/null
+++ b/test_bunc2tei.py
@@ -0,0 +1,34 @@
+import xml.etree.ElementTree as ET
+from bunc2tei import extract_data
+
+
+def test_extract_data():
+    tree = ET.parse('sample.xml')
+    root = tree.getroot()
+
+    data = extract_data('sample.xml')
+    assert len(data) == len(root.findall(".{http://www.tei-c.org/ns/1.0}text"))
+
+    assert data[0]['title'] == 'Най-ефективните методи за справяне с махмурлука'
+    assert data[1]['title'] == 'Полицията регистрира няколко катастрофи с пияни шофьори в новогодишната нощ'
+    assert data[2]['title'] == 'Какво влиза в сила от 1 януари 2020 г.'
+
+    assert data[0]['url'] == 'https://www.dnevnik.bg/detski_dnevnik/zdrave/2020/01/01/4011288_nai-efektivnite_metodi_za_spraviane_s_mahmurluka/'
+    assert data[1]['url'] == 'https://www.dnevnik.bg/skorost/2020/01/01/4011314_policiiata_registrira_niakolko_katastrofi_s_piiani/'
+    assert data[2]['url'] == 'https://www.dnevnik.bg/bulgaria/2020/01/01/4007490_kakvo_vliza_v_sila_ot_1_ianuari_2020_g/'
+
+    assert data[0]['author'] == 'Дневник'
+    assert data[1]['author'] == 'Георги Пауновски'
+    assert data[2]['author'] == 'Елена Геловска'
+
+    for i in range(len(data)):
+        assert data[i]['date'] == '2020-01-01'
+
+    assert data[0]['time'] == '10:41'
+    assert data[1]['time'] == '12:07'
+    assert data[2]['time'] == '07:33'
+
+  
+
+
+