Character Based OCR DL
1 개요
Character Based OCR은 문자 단위로 문자열을 인식하는 딥러닝 알고리즘입니다.
Source Image | Result Image |
---|---|
![]() |
![]() |
문자 단위로 라벨링을 하여 학습합니다. 다른 딥러닝 모델과는 달리 라벨에 클래스 번호를 추가하지 않고 문자를 클래스이름으로 사용합니다.
2 Character Based OCR 사용 방법
1 데이터 셋 준비
-
Figure를 이용하여 라벨링이 된 Flif 형식의 학습 이미지
- 이미지에 Figure를 삽입하여 학습 이미지를 생성할 수 있습니다. Figure에는 반드시 이름이 들어가야 하며 "문자 이름" 형식이여야 합니다.
- FLImaging에서 지원하는 모든 형식의 Figure로 라벨링할 수 있습니다. (라벨링 방법)
Fig. 이미지의 이름이 있는 Figure를 삽입하여 만든 학습 데이터 샘플입니다.
2.2 학습
2.2.1. 학습 이미지 설정
2.2.2. 검증 이미지 설정(선택)
2.2.3. 모델 설정
2.2.4. 옵티 마이저 설정
2.2.5. Augmentation 설정(선택)
2.2.6. 학습 수행
- Character Based OCR 의 경우 종료 조건은 mAP 1이 나왔을 때 모두 맞췄다는 의미므로 1로 설정하는게 좋습니다.
- 추천 종료 조건
mAP >= 1
2.2.7. 조건 식
- 종료 조건(Stop Condition) & 자동 저장(Auto Save)에서 사용 가능한 조건 식 입니다.
- Common Conditional Expression
- Character Based OCR Conditonal Expression
변수명 설명 Stop Condition 예시 Auto Save 예시 map 클래스 별로 정밀도(Precision)와 재현율(Recall)을 이용하여 여러 임계값에서 Precision-Recall 곡선을 그리고, 그 면적을 계산한 값의 평균입니다. 0 ~ 1 범위를 가지며 1로 갈수록 좋은 결과를 나타냅니다. cost <= 0.3 & map >= 1 epoch >= 10 & map >= max('map') & map > 0 metric map가 metric 사용됩니다. cost <= 0 | metric >= 1 epoch >= 10 & metric >= max('metric') & metric > 0 validation map가 validation으로 사용됩니다. cost <= 0 | validation >= 1 epoch >= 10 & validation >= max('validation') & validation > 0 - GUI 에서 설정 방법
- 종료 조건 식 설정
cost <= 0 | validation >= 1 | metric >= 1
Fig. GUI에서 종료 조건 설정 - 자동 저장 조건 식설정
epoch >= 10 & metric >= max('metric') & metric > 0
Fig. GUI에서 자동 저장 조건 설정
- 종료 조건 식 설정
2.3 추론
2.4 Save/Load
- Save/Load
- 모델파일을 저장하거나 불러옵니다.
- 확장자는 .flocrdl입니다.
3 필수 옵션
3.1 학습 필수 옵션
-
모델 설정
-
지원 모델
- R FL Seg Net(V1 128 / V1 256 / V1 512)
- 포스로직만의 효율적인 최신 AI 모델 설계 구조를 바탕으로 구현된 정밀한 결과를 도출하는 이미지 탐지 모델입니다.
- 추천 버전은 V1 512 입니다.
- Mask R CNN(V1 128 / V1 256 / v1 512)
- R FL Seg Net(V1 128 / V1 256 / V1 512)
-
API
SetModel(EModel eModel = EModel_FLSegNet)
eModel
: 학습에 사용할 모델을 설정합니다.
SetModelVersion(EModelVersion eModelVersion = EModelVersion_Mask_R_CNN_V1_512)
eModelVersion
: 학습에 사용할 모델의 버전을 설정합니다.
-
예제 코드
CResult res; CCharacterBasedOCRDL ocrDL; if((res = ocrDL.SetModel(CCharacterBasedOCRDL::EModel_R_FLSegNet)).IsFail()) return; if((res = ocrDL.SetModelVersion(CCharacterBasedOCRDL::EModelVersion_R_FLSegNet_V1_512)).IsFail()) return;
-
GUI에서 설정 방법
Fig. GUI에서 사용할 모델을 설정하는 Dropdown List
Fig. GUI에서 사용한 모델 확인(학습 현황 다이얼로그)
-
3.2 추론 필수 옵션
4 선택 옵션
4.1 학습 선택 옵션
- 검증 이미지 설정
- 검증 이미지를 설정합니다. 검증 이미지는 라벨링이 되어있어야 합니다. 검증지표는 mAP입니다.
- 검증 옵션 설정
-
검증 옵션을 설정합니다.
-
API
SetLearningValidationStep(int32_t i32ValidationStep = 1)
SetValidateResultObjectnessThreshold(float f32Threshold)
- 검증에 사용할 객체 임계 값을 설정합니다.
SetValidateResultNMSThreshold(float f32Threshold)
- 검증에 사용할 NMS 임계값을 설정합니다. 추천 값
0.5f
- 검증에 사용할 NMS 임계값을 설정합니다. 추천 값
SetValidateResultMaskThreshold(float f32Threshold)
- 검증에 사용할 Mask 임계값을 설정합니다.
-
예제 코드
CCharacterBasedOCRDL ocrDL; if(ocrDL.SetLearningValidationStep(5).IsFail()) return; if(ocrDL.SetValidateResultObjectnessThreshold(0.25).IsFail()) return; if(ocrDL.SetValidateResultMaskThreshold(0.25).IsFail()) return; if(ocrDL.SetValidateResultNMSThreshold(0.5).IsFail()) return;
-
GUI에서 사용 방법
Fig. GUI에서 검증 옵션 설정
-
- 옵티 마이저 설정
- Augmentation 설정
- 타일링 설정
- 이미지 전처리 설정
- 종료 조건 설정
- 자동 저장 조건 설정
- Class Equalization 설정
- Optimal Learning State Preservation 설정
- Pretrained Model 사용
4.2 추론 선택 옵션
-
추론 결과 옵션 설정
-
추론 결과 옵션을 설정합니다. Contour 혹은 Boundary Rect로 받을 수 있으며 클래스 번호, 클래스 이름, 스코어를 포함여부를 정할 수 있습니다.
-
추론 결과는 설정 된 ResultImage에 Figure로 출력 되게됩니다.
-
API
EnableInferenceResultStringMode(bool bEnable)
- 기본값은
true
이며 출력 결과를 String단위로 얻어옵니다. false
로 설정 시 문자 단위로 얻어옵니다.
- 기본값은
SetInferenceResultItemSettings(CInstanceSegmentationDL::EInferenceResultItemSettings eSetting)
- 출력 정보를 선택 합니다. IncludingRegionFigures flag가 true인 경우에만 표시됩니다.
- 출력 정보로는 Class Num, Class Name, Confidence Score를 선택할 수 있습니다.
- 기본 값으로 세 항목 모두 출력합니다.
- 기본 값
CInstanceSegmentationDL::EInferenceResultItemSettings_ClassNum_ClassName_Objectness_BoundaryRect_Contour
- 기본 값
SetInferenceResultObjectnessThreshold(float f32Threshold)
- 추론 시 결과의 객체 확신 값에 대한 임계 값을 설정합니다.
SetInferenceResultMaskThreshold(float f32Threshold)
- 추론 시 결과 마스크 영역의 값들에 대한 임계 값을 설정합니다.
SetInferenceResultNMSThreshold(float f32Threshold)
- 추론 시 NMS 임계 값을 설정합니다.
-
예제 코드
CCharacterBasedOCRDL ocrDL; // 출력 결과를 String으로 출력하도록 설정 if(ocrDL.EnableInferenceResultStringMode(true).IsFail()) return; // 클래스 번호, 클래스 이름, 객체 확신 값, 바운더리 박스, 영역으로 출력되도록 설정 if(ocrDL.SetInferenceResultItemSettings(CInstanceSegmentationDL::EInferenceResultItemSettings_Objectness_Contour).IsFail()) return; // Objectness Threshold 설정 if(ocrDL.SetInferenceResultObjectnessThreshold(0.5f).IsFail()) return; // Mask Threshold 설정 if(ocrDL.SetInferenceResultMaskThreshold(0.5f).IsFail()) return; // NMS Threshold 설정 if(ocrDL.SetInferenceResultNMSThreshold(0.5f).IsFail()) return;
-
GUI에서 사용 방법
Fig. GUI에서 추론 옵션 설정
5 결과 출력
- Inference 결과 출력
- Inference & Inference Result Image 설정을 통해 설정한 Result Image에 추론 결과가 출력 되어집니다.
- 옵션에 따라 라벨 값으로 이루어진 이미지 또는 찾은 영역의 Figure가 포함되게 됩니다.
- 학습 정보
-
학습 중 또는 학습이 완료된 마지막 결과를 얻어옵니다.
-
API
GetLearningResultLastMeanAP()
- 마지막 mAP(검증 Metric) 결과를 가져옵니다.
GetLearningResultMaxMeanAP()
- 최대 mAP(검증 Metric) 결과를 가져옵니다.
GetLearningResultMaxMeanAPCumulativeEpoch()
- 최대 학습 검증 MeanAP 결과의 에폭 수를 가져옵니다.
GetLearningResultAllHistory(Base::CFLArray<float>& flaCostHistory, Base::CFLArray<float>& flaValidationHistory, Base::CFLArray<int32_t>& flaValidationEpochHistory)
- 마지막 학습의 모든 결과를 가져옵니다.
- Cost, Accuracy, mIoU, ZE Accuracy, ZE mIoU, Validation Epoch
-
예제 코드
CCharacterBasedOCRDL ocrDL; float f32ResultLastMeanAP; float f32ResultMaxMeanAP; int32_t i32ResultMaxMeanAPCumulativeEpoch; CFLArray<float> flaCostHistory; CFLArray<float> flaValidationHistory; CFLArray<int32_t> flaValidationEpochHistory; f32ResultLastMeanAP = ocrDL.GetLearningResultLastMeanAP(); f32ResultMaxMeanAP = ocrDL.GetLearningResultMaxMeanAP(); i32ResultMaxMeanAPCumulativeEpoch = ocrDL.GetLearningResultMaxMeanAPCumulativeEpoch(); if(ocrDL.GetLearningResultAllHistory(flaCostHistory, flaValidationHistory, flaValidationEpochHistory).IsFail()) return;
-
GUI에서 확인 방법
Fig. GUI 프로퍼티에서 결과 확인(Epoch, Cost, Validation)
Fig. 학습 다이얼로그에서 현황 확인(Epoch, Cost, Validation)
Fig. 그래프 뷰에서 현황 확인(Cost, Validation)
-
-