fix identifier scope in layout OCR options (w/o full_layout)

2025-12-13 14:44:14 +01:00 · 2025-10-08 19:19:10 +02:00 · 2025-10-08 19:19:10 +02:00 · bb8f235585
commit bb8f235585
parent a7de13e900
1 changed files with 6 additions and 16 deletions
--- a/src/eynollah/eynollah.py
+++ b/src/eynollah/eynollah.py
@ -4744,6 +4744,11 @@ class Eynollah:
                    boxes_d, textline_mask_tot_d)
        self.logger.info(f"Detection of reading order took {time.time() - t_order:.1f}s")
        ocr_all_textlines = None
        ocr_all_textlines_marginals_left = None
        ocr_all_textlines_marginals_right = None
        ocr_all_textlines_h = None
        ocr_all_textlines_drop = None
        if self.ocr:
            self.logger.info("Step 4.5/5: OCR Processing")
@ -4754,36 +4759,26 @@ class Eynollah:
                    ocr_all_textlines = return_rnn_cnn_ocr_of_given_textlines(
                        image_page, all_found_textline_polygons, all_box_coord,
                        self.prediction_model, self.b_s_ocr, self.num_to_char, self.textline_light, self.curved_line)
                else:
                    ocr_all_textlines = None
                if len(all_found_textline_polygons_marginals_left):
                    ocr_all_textlines_marginals_left = return_rnn_cnn_ocr_of_given_textlines(
                        image_page, all_found_textline_polygons_marginals_left, all_box_coord_marginals_left,
                        self.prediction_model, self.b_s_ocr, self.num_to_char, self.textline_light, self.curved_line)
                else:
                    ocr_all_textlines_marginals_left = None
                if len(all_found_textline_polygons_marginals_right):
                    ocr_all_textlines_marginals_right = return_rnn_cnn_ocr_of_given_textlines(
                        image_page, all_found_textline_polygons_marginals_right, all_box_coord_marginals_right,
                        self.prediction_model, self.b_s_ocr, self.num_to_char, self.textline_light, self.curved_line)
                else:
                    ocr_all_textlines_marginals_right = None
                if self.full_layout and len(all_found_textline_polygons):
                    ocr_all_textlines_h = return_rnn_cnn_ocr_of_given_textlines(
                        image_page, all_found_textline_polygons_h, all_box_coord_h,
                        self.prediction_model, self.b_s_ocr, self.num_to_char, self.textline_light, self.curved_line)
                else:
                    ocr_all_textlines_h = None
                if self.full_layout and len(polygons_of_drop_capitals):
                    ocr_all_textlines_drop = return_rnn_cnn_ocr_of_given_textlines(
                        image_page, polygons_of_drop_capitals, np.zeros((len(polygons_of_drop_capitals), 4)),
                        self.prediction_model, self.b_s_ocr, self.num_to_char, self.textline_light, self.curved_line)
                else:
                    ocr_all_textlines_drop = None
            else:
                if self.light_version:
@ -4800,6 +4795,7 @@ class Eynollah:
                ind_tot = 0
                #cv2.imwrite('./img_out.png', image_page)
                ocr_all_textlines = []
                # FIXME: what about lines in marginals / headings / drop-capitals here?
                for indexing, ind_poly_first in enumerate(all_found_textline_polygons):
                    ocr_textline_in_textregion = []
                    for indexing2, ind_poly in enumerate(ind_poly_first):
@ -4835,12 +4831,6 @@ class Eynollah:
                        ocr_textline_in_textregion.append(text_ocr)
                        ind_tot = ind_tot +1
                    ocr_all_textlines.append(ocr_textline_in_textregion)
        else:
            ocr_all_textlines = None
            ocr_all_textlines_marginals_left = None
            ocr_all_textlines_marginals_right = None
            ocr_all_textlines_h = None
            ocr_all_textlines_drop = None
        self.logger.info("Step 5/5: Output Generation")