diff --git a/qurator/modstool/tests/data/alto/734008031/00000005.xml b/qurator/modstool/tests/data/alto/734008031/00000005.xml new file mode 100644 index 0000000..93e2865 --- /dev/null +++ b/qurator/modstool/tests/data/alto/734008031/00000005.xml @@ -0,0 +1,170 @@ + + + + pixel + + + 2016-08-07 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/734008031/00000026.xml b/qurator/modstool/tests/data/alto/734008031/00000026.xml new file mode 100644 index 0000000..5883b6b --- /dev/null +++ b/qurator/modstool/tests/data/alto/734008031/00000026.xml @@ -0,0 +1,726 @@ + + + + pixel + + + 2016-08-07 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/734008031/00000029.xml b/qurator/modstool/tests/data/alto/734008031/00000029.xml new file mode 100644 index 0000000..2c6b73a --- /dev/null +++ b/qurator/modstool/tests/data/alto/734008031/00000029.xml @@ -0,0 +1,719 @@ + + + + pixel + + + 2016-08-07 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/734008031/00000060.xml b/qurator/modstool/tests/data/alto/734008031/00000060.xml new file mode 100644 index 0000000..cb2ed13 --- /dev/null +++ b/qurator/modstool/tests/data/alto/734008031/00000060.xml @@ -0,0 +1,768 @@ + + + + pixel + + + 2016-08-07 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/734008031/00000102.xml b/qurator/modstool/tests/data/alto/734008031/00000102.xml new file mode 100644 index 0000000..c8fe63d --- /dev/null +++ b/qurator/modstool/tests/data/alto/734008031/00000102.xml @@ -0,0 +1,818 @@ + + + + pixel + + + 2016-08-07 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/749782137/00000077.xml b/qurator/modstool/tests/data/alto/749782137/00000077.xml new file mode 100644 index 0000000..f6dc49f --- /dev/null +++ b/qurator/modstool/tests/data/alto/749782137/00000077.xml @@ -0,0 +1,618 @@ + + + + pixel + + + 2016-03-03 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/749782137/00000085.xml b/qurator/modstool/tests/data/alto/749782137/00000085.xml new file mode 100644 index 0000000..f4787c2 --- /dev/null +++ b/qurator/modstool/tests/data/alto/749782137/00000085.xml @@ -0,0 +1,856 @@ + + + + pixel + + + 2016-03-03 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/749782137/00000464.xml b/qurator/modstool/tests/data/alto/749782137/00000464.xml new file mode 100644 index 0000000..e227c3e --- /dev/null +++ b/qurator/modstool/tests/data/alto/749782137/00000464.xml @@ -0,0 +1,496 @@ + + + + pixel + + + 2016-03-03 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/749782137/00000651.xml b/qurator/modstool/tests/data/alto/749782137/00000651.xml new file mode 100644 index 0000000..d4731c6 --- /dev/null +++ b/qurator/modstool/tests/data/alto/749782137/00000651.xml @@ -0,0 +1,1005 @@ + + + + pixel + + + 2016-03-03 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/749782137/00000915.xml b/qurator/modstool/tests/data/alto/749782137/00000915.xml new file mode 100644 index 0000000..66324ec --- /dev/null +++ b/qurator/modstool/tests/data/alto/749782137/00000915.xml @@ -0,0 +1,1023 @@ + + + + pixel + + + 2016-03-03 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/749782137/00001120.xml b/qurator/modstool/tests/data/alto/749782137/00001120.xml new file mode 100644 index 0000000..517c7e2 --- /dev/null +++ b/qurator/modstool/tests/data/alto/749782137/00001120.xml @@ -0,0 +1,1629 @@ + + + + pixel + + + 2016-03-03 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/PPN636777308/00000002.xml b/qurator/modstool/tests/data/alto/PPN636777308/00000002.xml new file mode 100644 index 0000000..e22c338 --- /dev/null +++ b/qurator/modstool/tests/data/alto/PPN636777308/00000002.xml @@ -0,0 +1,171 @@ + + + + mm10 + + F:\Batch SBB\dachklag_635359391_orig\00000003.tif + + + + 2011-06-29T09:05:04 + Staatsbibliothek zu Berlin – PK + Color Enhancement + ContrastR=0.5 ContrastG=0.5 ContrastB=0.5 GammaR=1.0 GammaG=1.0 GammaB=1.0 LuminanceR=0.5 LuminanceG=0.5 LuminanceB=0.5 + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:04 + Staatsbibliothek zu Berlin – PK + Rotation + Type=None Margins={Left=0.5 Right=0.5 Top=0.800000011920929 Bottom=0.5} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:04 + Staatsbibliothek zu Berlin – PK + Binarisation + SourceBPP=24 Algorithm=Intensity based algorithm + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:08 + Staatsbibliothek zu Berlin – PK + Cleaning + ContrastR=0.5 ContrastG=0.5 ContrastB=0.5 GammaR=1.0 GammaG=1.0 GammaB=1.0 LuminanceR=0.5 LuminanceG=0.5 LuminanceB=0.5 + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:10 + Staatsbibliothek zu Berlin – PK + Remove Dots + ContrastR=0.5 ContrastG=0.5 ContrastB=0.5 GammaR=1.0 GammaG=1.0 GammaB=1.0 LuminanceR=0.5 LuminanceG=0.5 LuminanceB=0.5 + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:16 + Staatsbibliothek zu Berlin – PK + Blackborder elimination + ContrastR=0.5 ContrastG=0.5 ContrastB=0.5 GammaR=1.0 GammaG=1.0 GammaB=1.0 LuminanceR=0.5 LuminanceG=0.5 LuminanceB=0.5 + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:21 + Staatsbibliothek zu Berlin – PK + Detection of horizonzal lines + ForceBitmap=true MaxThickness=0.5 MinThickness=0.0 MaxWhiteLength=0.1 MinBlackLength=0.9 MinTotalLength=2.0 Margins={Left=0.5 Right=0.5 Top=0.800000011920929 Bottom=0.5} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:23 + Staatsbibliothek zu Berlin – PK + Detection of vertical lines + ForceBitmap=true MaxThickness=0.1 MinThickness=0.0 MaxWhiteLength=0.0 MinBlackLength=0.9 MinTotalLength=5.0 Margins={Left=0.5 Right=0.5 Top=0.800000011920929 Bottom=0.5} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:24 + Staatsbibliothek zu Berlin – PK + Segmentation + MinHeight=0.1 MinWidth=0.1 MinVertDist=2.0 MinHorDist=2.0 Margins={Left=0.5 Right=0.5 Top=0.800000011920929 Bottom=0.5} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:24 + Staatsbibliothek zu Berlin – PK + Region identification + Default=Binary ColorRegions={Detect=false} PaletteRegions={Detect=false} BinaryRegions={Detect=false} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + 2011-06-29T09:05:24 + Staatsbibliothek zu Berlin – PK + Optical Character Recognition + not implemented. + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.595 (Rel. 38) + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/PPN640992293/00000017.xml b/qurator/modstool/tests/data/alto/PPN640992293/00000017.xml new file mode 100644 index 0000000..573af13 --- /dev/null +++ b/qurator/modstool/tests/data/alto/PPN640992293/00000017.xml @@ -0,0 +1,1213 @@ + + + + mm10 + + Ee705-0301_00000017.tif + + + + 2012-02-17T11:30:51 + B.I.T. Bureau Ingénieur Tomasi (France) + Color Enhancement + ContrastR=0.5 ContrastG=0.5 ContrastB=0.5 GammaR=1.0 GammaG=1.0 GammaB=1.0 LuminanceR=0.55 LuminanceG=0.55 LuminanceB=0.55 + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:30:51 + B.I.T. Bureau Ingénieur Tomasi (France) + Rotation + Type=None Margins={Left=0.5 Right=0.5 Top=0.800000011920929 Bottom=0.5} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:30:51 + B.I.T. Bureau Ingénieur Tomasi (France) + Binarisation + SourceBPP=8 Algorithm=Intensity based algorithm + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:30:58 + B.I.T. Bureau Ingénieur Tomasi (France) + Cleaning + ContrastR=0.5 ContrastG=0.5 ContrastB=0.5 GammaR=1.0 GammaG=1.0 GammaB=1.0 LuminanceR=0.55 LuminanceG=0.55 LuminanceB=0.55 + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:31:02 + B.I.T. Bureau Ingénieur Tomasi (France) + Remove Dots + ContrastR=0.5 ContrastG=0.5 ContrastB=0.5 GammaR=1.0 GammaG=1.0 GammaB=1.0 LuminanceR=0.55 LuminanceG=0.55 LuminanceB=0.55 + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:31:09 + B.I.T. Bureau Ingénieur Tomasi (France) + Blackborder elimination + ContrastR=0.5 ContrastG=0.5 ContrastB=0.5 GammaR=1.0 GammaG=1.0 GammaB=1.0 LuminanceR=0.55 LuminanceG=0.55 LuminanceB=0.55 + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:31:11 + B.I.T. Bureau Ingénieur Tomasi (France) + Detection of horizonzal lines + ForceBitmap=true MaxThickness=0.699999988079071 MinThickness=0.0 MaxWhiteLength=0.2 MinBlackLength=0.3 MinTotalLength=1.0 Margins={Left=0.5 Right=0.5 Top=0.800000011920929 Bottom=0.5} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:31:12 + B.I.T. Bureau Ingénieur Tomasi (France) + Detection of vertical lines + ForceBitmap=true MaxThickness=2.0 MinThickness=0.0 MaxWhiteLength=0.1 MinBlackLength=0.9 MinTotalLength=10.0 Margins={Left=0.5 Right=0.5 Top=0.800000011920929 Bottom=0.5} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:31:14 + B.I.T. Bureau Ingénieur Tomasi (France) + Segmentation + MinHeight=0.1 MinWidth=0.1 MinVertDist=2.0 MinHorDist=2.0 Margins={Left=0.5 Right=0.5 Top=0.800000011920929 Bottom=0.5} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:31:14 + B.I.T. Bureau Ingénieur Tomasi (France) + Region identification + Default=Binary ColorRegions={Detect=false} PaletteRegions={Detect=false} BinaryRegions={Detect=false} + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + 2012-02-17T11:31:15 + B.I.T. Bureau Ingénieur Tomasi (France) + Optical Character Recognition + not implemented. + + B.I.T. Bureau Ingénieur Tomasi + BIT-Alpha + 2.0.38.614 (Rel. 38) + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/PPN715049151/00000017.xml b/qurator/modstool/tests/data/alto/PPN715049151/00000017.xml new file mode 100644 index 0000000..303416b --- /dev/null +++ b/qurator/modstool/tests/data/alto/PPN715049151/00000017.xml @@ -0,0 +1,558 @@ + + + + + + Ee705-1400_00000123_FR.xml + + + + 2013-12-16 + OCR Average Character Confidence 94.17% + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/PPN767883624/00000001.xml b/qurator/modstool/tests/data/alto/PPN767883624/00000001.xml new file mode 100644 index 0000000..41619c6 --- /dev/null +++ b/qurator/modstool/tests/data/alto/PPN767883624/00000001.xml @@ -0,0 +1,90 @@ + + + + pixel + + + 2014-05-21 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/PPN767883624/00000002.xml b/qurator/modstool/tests/data/alto/PPN767883624/00000002.xml new file mode 100644 index 0000000..fd434c3 --- /dev/null +++ b/qurator/modstool/tests/data/alto/PPN767883624/00000002.xml @@ -0,0 +1,75 @@ + + + + pixel + + + 2014-05-21 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/PPN895016346/00000022.xml b/qurator/modstool/tests/data/alto/PPN895016346/00000022.xml new file mode 100644 index 0000000..e78b638 --- /dev/null +++ b/qurator/modstool/tests/data/alto/PPN895016346/00000022.xml @@ -0,0 +1,2021 @@ + + + + pixel + + MAX/FILE_0022_MAX.tif + + + layout/segmentation/region + {"allow_scaling": "False", "curved_line": "False", "dpi": "0", "full_layout": "True", "headers_off": "False", "models": "/data/default"} + + ocrd-eynollah-segment + + + + preprocessing/optimization/binarization + {"model": "/data/sbb_binarization/models", "operation_level": "page"} + + ocrd-sbb-binarize + + + + recognition/text-recognition + {"checkpoint": "/data/calamari_models/*ckpt.json", "checkpoint_dir": "/data/calamari_models", "glyph_conf_cutoff": "0.001", "textequiv_level": "word", "voter": "confidence_voter_default_ctc"} + + ocrd-calamari-recognize + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/alto-ner/00000046.xml b/qurator/modstool/tests/data/alto/alto-ner/00000046.xml new file mode 100644 index 0000000..d0c956f --- /dev/null +++ b/qurator/modstool/tests/data/alto/alto-ner/00000046.xml @@ -0,0 +1,56 @@ + + +pixel +2013-11-26ABBYYABBYY FineReader Engine10 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + \ No newline at end of file diff --git a/qurator/modstool/tests/data/alto/alto-ner/00000102.xml b/qurator/modstool/tests/data/alto/alto-ner/00000102.xml new file mode 100644 index 0000000..9d01f76 --- /dev/null +++ b/qurator/modstool/tests/data/alto/alto-ner/00000102.xml @@ -0,0 +1,820 @@ + + + + pixel + + + 2016-08-07 + + ABBYY + ABBYY FineReader Engine + 11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/alto/alto-ner/00000217.xml b/qurator/modstool/tests/data/alto/alto-ner/00000217.xml new file mode 100644 index 0000000..9619b23 --- /dev/null +++ b/qurator/modstool/tests/data/alto/alto-ner/00000217.xml @@ -0,0 +1,69 @@ + + +pixel +2016-08-07ABBYYABBYY FineReader Engine11 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + \ No newline at end of file diff --git a/qurator/modstool/tests/data/alto/weird-ns/00000007.xml b/qurator/modstool/tests/data/alto/weird-ns/00000007.xml new file mode 100644 index 0000000..4c8f364 --- /dev/null +++ b/qurator/modstool/tests/data/alto/weird-ns/00000007.xml @@ -0,0 +1,331 @@ + + + + + + 00000007_FR.xml + + + + 2013-12-18 + OCR Average Character Confidence 89.97% + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/mets-mods/PPN1678618276.xml b/qurator/modstool/tests/data/mets-mods/PPN1678618276.xml new file mode 100644 index 0000000..c788338 --- /dev/null +++ b/qurator/modstool/tests/data/mets-mods/PPN1678618276.xml @@ -0,0 +1,167 @@ + + + + + Kitodo - kitodo-ugh-2.1.3-kitodo-ugh-2.1.1-11-g4b06eaa - 30−July−2019 + Kitodo + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Berlin, Germany + 55 Nachl 100/B,25431 + + + + Wertheim + + 1825 + 1825-07-30 + + + + Berlin + + 2019 + Staatsbibliothek zu Berlin – Preußischer Kulturbesitz, Germany + [Electronic ed.] + + Musik + Nachlässe und Autographe + Schott-Archiv + + PPN1678618276 + + http://resolver.staatsbibliothek-berlin.de/SBB0002A14000000000 + 3489696 + + Brief an B. Schott's Söhne : 30.07.1825 + + P_SBB_Sondermat_Nachlaesse + + ... + Goebel + + aut + + + + B. Schott's Söhne + 106168096 + + oth + + + + reformatted digital + 1 Br., 1 S. + + + + Nachlässe und Autographe digital + + + + + Schott-Archiv digital + + + CC BY-NC-SA 4.0 International + text + + + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz + http://resolver.staatsbibliothek-berlin.de/SBB0000000100000000 + http://www.staatsbibliothek-berlin.de + mailto:info@sbb.spk-berlin.de + + + + + + + + + http://www.stabikat.de/DB=1/PPN?PPN=1678618276 + http://digital.staatsbibliothek-berlin.de/dms/werkansicht/?PPN=PPN1678618276 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/mets-mods/PPN1727545451.xml b/qurator/modstool/tests/data/mets-mods/PPN1727545451.xml new file mode 100644 index 0000000..8912858 --- /dev/null +++ b/qurator/modstool/tests/data/mets-mods/PPN1727545451.xml @@ -0,0 +1,107 @@ + + + + + Kitodo - kitodo-ugh-2.1.3-kitodo-ugh-2.1.1-11-g4b06eaa - 30−July−2019 + Kitodo + + + + + + + + + Mengeringhausen + + [Verlag nicht ermittelbar] + 1853 + 1918 + + + + Berlin + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Germany + [Electronic ed.] + + Historische Drucke + Politik / Staat / Gesellschaft / Wirtschaft + + PPN1727545451 + + http://resolver.staatsbibliothek-berlin.de/SBB0002D69800000000 + + + PPN167755803 + + + 3034884-5 + + Verhandlungen des Landtags der Fürstentümer Waldeck und Pyrmont + Landtags-Protokolle / Anlagen + + 6. December 1853-1865, Nr. 3 (19. December 1865) ; 1866, Nr. 4 (20. Febr. 1866)-1913, Nr. 2 (2. Dezember 1913) ; 23. November 1915 ; 1916, Nr. 1 (28. November 1916)-Nr. 2 (12. Dezember) ; 1918 + P_Drucke_Allg_bis1920 + + ger + + + + Historische Drucke digital + + + + Staat Waldeck Landtag + Staat Waldeck + Landtag + 102225370 + + aut + + + + reformatted digital + + + + Landtages + + + UNKNOWN + text + + + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz + http://resolver.staatsbibliothek-berlin.de/SBB0000000100000000 + http://www.staatsbibliothek-berlin.de + mailto:info@sbb.spk-berlin.de + + + + + + + + + http://www.stabikat.de/DB=1/PPN?PPN=1727545451 + http://digital.staatsbibliothek-berlin.de/dms/werkansicht/?PPN=PPN1727545451 + https://content.staatsbibliothek-berlin.de/dc/PPN1727545451/manifest + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/mets-mods/PPN1737752050.xml b/qurator/modstool/tests/data/mets-mods/PPN1737752050.xml new file mode 100644 index 0000000..e4473b6 --- /dev/null +++ b/qurator/modstool/tests/data/mets-mods/PPN1737752050.xml @@ -0,0 +1,509 @@ + + + + + Kitodo - kitodo-ugh-2.1.3-kitodo-ugh-2.1.1-11-g4b06eaa - 30−July−2019 + Kitodo + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Berlin, Germany + DMS 860 + + + + Berlin + + 1885 + C.A. Challier & Co. + + + + Berlin + + 2020 + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Germany + [Electronic ed.] + + Musiknoten + Musikdrucke + + PPN1737752050 + + http://resolver.staatsbibliothek-berlin.de/SBB0002E62700000000 + PPN1737748428 + + Vier Gedichte von Helene von Hülsen + für eine Singstimme und Pianoforte : Op. 61 + + P_Drucke_Noten + + ger + eng + + + + Musikdrucke digital + + + + Hofmann, Heinrich + Heinrich + 134581148 + Hofmann + + cmp + + + + Hülsen, Helene, von + Helene + 133449238 + Hülsen + von + + aut + + + + reformatted digital + 1 Partitur (19 Seiten) + + + 215 + + Public Domain Mark 1.0 + text + + + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz + http://resolver.staatsbibliothek-berlin.de/SBB0000000100000000 + http://www.staatsbibliothek-berlin.de + mailto:info@sbb.spk-berlin.de + + + + + + + + + http://www.stabikat.de/DB=1/PPN?PPN=1737752050 + http://digital.staatsbibliothek-berlin.de/dms/werkansicht/?PPN=PPN1737752050 + https://content.staatsbibliothek-berlin.de/dc/PPN1737752050/manifest + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/mets-mods/PPN1769395962.xml b/qurator/modstool/tests/data/mets-mods/PPN1769395962.xml new file mode 100644 index 0000000..8a88f80 --- /dev/null +++ b/qurator/modstool/tests/data/mets-mods/PPN1769395962.xml @@ -0,0 +1,260 @@ + + + + + Kitodo - kitodo-ugh-2.1.3-kitodo-ugh-2.1.1-11-g4b06eaa - 30−July−2019 + Kitodo + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Berlin, Germany + DMS 22613 + + + + Berlin + + + [Deutschland?] + + 1890 + Georg Plothow + Pantheon-Verlag Bruno C.L. Plothow + + + + Berlin + + 2021 + Staatsbibliothek zu Berlin – Preußischer Kulturbesitz, Germany + [Electronic ed.] + + Musiknoten + Musikdrucke + + + PPN1769395032 + + + + PPN1769395962 + + http://resolver.staatsbibliothek-berlin.de/SBB000309C200060000 + + + PPN1769388664 + + + + Kinderlied + Op. 25 No. 6 + + P_Drucke_Noten + + + No. 6 + + + + ger + 215 + + + eng + + + + Musikdrucke digital + + + + Wurm, Mary + Mary + 078789583 + Wurm + + cmp + + + aut + + + + Marshall, Florence + Florence + 705064530 + Marshall + + trl + + + + reformatted digital + 1 Partitur (3 Seiten), 1 Stimme (1 Seite) + + Public Domain Mark 1.0 + text + open access + + + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz + http://resolver.staatsbibliothek-berlin.de/SBB0000000100000000 + http://www.staatsbibliothek-berlin.de + mailto:info@sbb.spk-berlin.de + + + + + + + + + http://www.stabikat.de/DB=1/PPN?PPN=1769395962 + http://digital.staatsbibliothek-berlin.de/dms/werkansicht/?PPN=PPN1769395962 + https://content.staatsbibliothek-berlin.de/dc/PPN1769395962/manifest + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/mets-mods/PPN3348760607-mehrere-shelfLocator.xml b/qurator/modstool/tests/data/mets-mods/PPN3348760607-mehrere-shelfLocator.xml new file mode 100644 index 0000000..6c23b77 --- /dev/null +++ b/qurator/modstool/tests/data/mets-mods/PPN3348760607-mehrere-shelfLocator.xml @@ -0,0 +1,380 @@ + + + + + Kitodo - kitodo-ugh-2.1.3-kitodo-ugh-2.1.1-11-g4b06eaa - 30−July−2019 + Kitodo + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Berlin, Germany + Libri sin. 21c + Ms sin. 21 + Libri sin. 21 + Libri sin. 21c + + + 刻本 + + + + Berlin + + 2014 + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Germany + [Electronic ed.] + + Historische Drucke + Ostasiatica + Sinica + + PPN3348760607 + + http://resolver.staatsbibliothek-berlin.de/SBB0001589A00000000 + PPN3348760593 + + 赤道南北兩總星圖 8幅 (殘, 存4幅) + + + chi dao nan bei liang zong xing tu + + + 赤道南北两总星图 + + + zh + + chidanab + + + SSG 6,25 Digital : Digitalisierung des Sondersammelgebiets Ost- und Südostasien der Staatsbibliothek zu Berlin – ostasiatischer Bestand + + + + + aut + + Schall von Bell + Johann Adam + Schall von Bell, Johann Adam + + + + aut + + + 光啓 + 徐, 光啓 + + + + fnd + + Deutsche Forschungsgemeinschaft + + + reformatted digital + Online-Ressource (4 幅) + + + + + + + + + + + + [第八幅上部 : 圖說 [上部]丶 歲星緯圖丶 赤道經緯儀丶 熒惑星緯圖] + + Blatt VIII + + + + + + + + + + [第八幅下部 : 圖說 [下部]丶 紀限儀丶 太白緯圖] + + Blatt VIII + + + + + + + + + + [第七幅上部 : 填星緯圖丶 赤道南圖 [左上部]] + + Blatt VII + + + + + + + + + + [第七幅下部 : 辰星緯圖丶 赤道南圖 [左下部]] + + Blatt VII + + + + + + + + + + [第六幅上部 : 赤道南圖 [中上部]] + + Blatt VI + + + + + + + + + + [第六幅下部 : 赤道南圖 [中下部]丶 星等表] + + Blatt VI + + + + + + + + + + [第五幅上部 : 赤道南圖 [右上部]丶 [圖說]丶 [星圖]] + + Blatt V + + + + + + + + + + [第五幅下部 : 赤道南圖 [右下部]丶 [圖說]丶 [星圖]] + + Blatt V + + + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz + http://resolver.staatsbibliothek-berlin.de/SBB0000000100000000 + http://www.staatsbibliothek-berlin.de + mailto:info@sbb.spk-berlin.de + + + + + + + + + http://gso.gbv.de/DB=1.97/PPN?PPN=3348760607 + http://digital.staatsbibliothek-berlin.de/dms/werkansicht/?PPN=PPN3348760607 + https://content.staatsbibliothek-berlin.de/dc/PPN3348760607/manifest + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/qurator/modstool/tests/data/mets-mods/PPN773555676.xml b/qurator/modstool/tests/data/mets-mods/PPN773555676.xml new file mode 100644 index 0000000..4eadfcd --- /dev/null +++ b/qurator/modstool/tests/data/mets-mods/PPN773555676.xml @@ -0,0 +1,405 @@ + + + + + Goobi - UGH-1.11.1-v1.11.0-11-gbafb11b - 16−November−2015 + Goobi + + + ocrd-sbb-binarize v0.0.8 + + + ocrd-eynollah-segment v0.0.7 + + + ocrd-calamari-recognize v1.0.3 (calamari 1.0.5, tensorflow 2.5.0) + + + + + + + + DE-1 + Ye 6081 + + + + [S.l.] + + 1619 + + + + Berlin + + 2014 + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Germany + [Electronic ed.] + + Historische Drucke + Sprachen / Literaturen + Musik + + PPN773555676 + + http://resolver.staatsbibliothek-berlin.de/SBB0001458F00000000 + 1:692277T + + + PPN537331794 + + + + Zwey Böhmische Lieder verdeutscht + I. Wie in einem Uffzug/ das Bawrenvolck in Böhmen/ den jäm[m]erlichen Zustand ihres Lands/ Ihrem König Friderichen/ Pfaltzgraffen bey Rhein und Churfürsten [et]c. beym Einritt zu Prag geklagt ... II. Wie es bey höchstbemeldten Königs/ und seiner Königlichen Gemahlin/ Elisabethen/ Princessin in GrosBrittannien/ Krönung zu Prag zugangen + + P_SBB_Drucke_VDLiedDigital + VD17 1:692277T + Nehlsen. BLF 1972 + Lied + Flugschrift + + ger + + + + VD Lied digital - Berliner Liedflugschriften + + + + + VD17 digital + + + + + asn + + Friedrich <V.> < Pfalz, Kurfürst> + Friedrich <V.> < Pfalz, Kurfürst> + + + + fnd + + Deutsche Forschungsgemeinschaft + + + reformatted digital + [4] Bl + + + + + Zwei + + + Public Domain Mark 1.0 + text + + + + + + + + + + 1619 + + + + Berlin + + 2013 + Staatsbibliothek zu Berlin – Preußischer Kulturbesitz, Germany + [Electronic ed.] + + + PPN777148331 + + http://resolver.staatsbibliothek-berlin.de/SBB0001458F00010000 + + + PPN777085771 + + + + Wjllkommen/ König Friederich: || Jn Jesu namen grüssen dich || + + Liedanfang [Vorlage]: (W)Jllkommen/ Kœnig Friederich: || Jn Jesu namen grüssen dich || + Liedanfang [normiert]: Willkommen König Friederich/ in Jesu Namen grüßen dich + Strophen/Zeilen: 72/4 + Nehlsen. BLF 1972, 1 + Lied + + ger + + + + VD Lied digital - Berliner Liedflugschriften + + + + reformatted digital + S. [2 - 5] + + Public Domain Mark 1.0 + text + + + + + + + + + + 1619 + + + + Berlin + + 2013 + Staatsbibliothek zu Berlin – Preußischer Kulturbesitz, Germany + [Electronic ed.] + + + PPN777148463 + + http://resolver.staatsbibliothek-berlin.de/SBB0001458F00020000 + + + PPN777086026 + + + + Das Ander Lied. + + Liedanfang [Vorlage]: (L)Aßt hoch vns halten was ich sag: || Grosse frewd ist in gantz Prag || + Liedanfang [normiert]: Laßt hoch uns halten was ich sag/ große Freud ist in ganz Prag + Strophen/Zeilen: 69/4 + Nehlsen. BLF 1972, 2 + Lied + + ger + + + + VD Lied digital - Berliner Liedflugschriften + + + + reformatted digital + S. [5 - 8] + + Public Domain Mark 1.0 + text + + + + + + + + + + Staatsbibliothek zu Berlin - Preußischer Kulturbesitz + http://resolver.staatsbibliothek-berlin.de/SBB0000000100000000 + http://www.staatsbibliothek-berlin.de + mailto:info@sbb.spk-berlin.de + + + + + + + + + http://www.stabikat.de/DB=1/PPN?PPN=773555676 + http://digital.staatsbibliothek-berlin.de/dms/werkansicht/?PPN=PPN773555676 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +