|
| 1 | +# -*- coding: utf-8 -*- |
| 2 | +import pytest |
| 3 | + |
| 4 | +GOLDEN_SK_RULES_TEST_CASES = [ |
| 5 | + ("Ide o majiteľov firmy ABTrade s. r. o., ktorí stoja aj za ďalšími spoločnosťami, napr. XYZCorp a.s.", |
| 6 | + ["Ide o majiteľov firmy ABTrade s. r. o., ktorí stoja aj za ďalšími spoločnosťami, napr. XYZCorp a.s."]), |
| 7 | + ("„Prieskumy beriem na ľahkú váhu. V podstate ma to nezaujíma,“ reagoval Matovič na prieskum agentúry Focus.", |
| 8 | + ["„Prieskumy beriem na ľahkú váhu. V podstate ma to nezaujíma,“ reagoval Matovič na prieskum agentúry Focus."]), |
| 9 | + ("Toto sa mi podarilo až na 10. pokus, ale stálo to za to.", |
| 10 | + ["Toto sa mi podarilo až na 10. pokus, ale stálo to za to."]), |
| 11 | + ("Ide o príslušníkov XII. Pluku špeciálneho určenia.", |
| 12 | + ["Ide o príslušníkov XII. Pluku špeciálneho určenia."]), |
| 13 | + ("Spoločnosť bola založená 7. Apríla 2020, na zmluve však figuruje dátum 20. marec 2020.", |
| 14 | + ["Spoločnosť bola založená 7. Apríla 2020, na zmluve však figuruje dátum 20. marec 2020."]), |
| 15 | +] |
| 16 | + |
| 17 | + |
| 18 | +@pytest.mark.parametrize('text,expected_sents', GOLDEN_SK_RULES_TEST_CASES) |
| 19 | +def test_pl_sbd(sk_default_fixture, text, expected_sents): |
| 20 | + """Slovak language SBD tests""" |
| 21 | + segments = sk_default_fixture.segment(text) |
| 22 | + segments = [s.strip() for s in segments] |
| 23 | + assert segments == expected_sents |
0 commit comments