Skip to content
GitLab
Projects
Groups
Snippets
/
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
kihoon.lee
dataset
Commits
d913071c
Commit
d913071c
authored
Aug 08, 2024
by
kihoon.lee
Browse files
update;
parent
9fa6c344
Changes
3
Expand all
Hide whitespace changes
Inline
Side-by-side
question_recommendation/QR_v1.5.2.json
0 → 100644
View file @
d913071c
This diff is collapsed.
Click to expand it.
question_recommendation/README.md
View file @
d913071c
...
@@ -4,5 +4,7 @@
...
@@ -4,5 +4,7 @@
| QR_v1.3 | 8,650개 | QR_v1.2 + QC 데이터셋 + 테스트 당시 안나온 질문들 |
| QR_v1.3 | 8,650개 | QR_v1.2 + QC 데이터셋 + 테스트 당시 안나온 질문들 |
| QR_v1.4 | 9,573개 | QR_v1.3 + OCR 데이터 129개 + 롯데GPT 로그(24.07.29 기준, 794건)|
| QR_v1.4 | 9,573개 | QR_v1.3 + OCR 데이터 129개 + 롯데GPT 로그(24.07.29 기준, 794건)|
| QR_v1.5.1 | 9,573개 | QR_v1.4 추천질의 전체 업데이트 (사용자입장에서 더 다양하게 질문할 수 있도록 + 추천질의 포맷 전부 동일하게)|
| QR_v1.5.1 | 9,573개 | QR_v1.4 추천질의 전체 업데이트 (사용자입장에서 더 다양하게 질문할 수 있도록 + 추천질의 포맷 전부 동일하게)|
| QR_v1.5.2 | 9,561개 | 롯데GPT야, 롯데GPT님, 등 제거|
question_recommendation/check_size.ipynb
View file @
d913071c
...
@@ -16,12 +16,12 @@
...
@@ -16,12 +16,12 @@
"source": [
"source": [
"import json\n",
"import json\n",
"\n",
"\n",
"file_path = 'QR_v1.
4
.json'\n",
"file_path = 'QR_v1.
5.2
.json'\n",
"\n",
"\n",
"with open(file_path, 'r', encoding='utf-8') as file:\n",
"with open(file_path, 'r', encoding='utf-8') as file:\n",
" data = json.load(file)\n",
" data = json.load(file)\n",
"\n",
"\n",
"print(f\"
QR_v1.4
데이터 개수: {len(data)}개\")"
"print(f\"
{file_path.split('.json')[0]}
데이터 개수: {len(data)}개\")"
]
]
},
},
{
{
...
...
%% Cell type:code id: tags:
%% Cell type:code id: tags:
```
python
```
python
import
json
import
json
file_path
=
'QR_v1.
4
.json'
file_path
=
'QR_v1.
5.2
.json'
with
open
(
file_path
,
'r'
,
encoding
=
'utf-8'
)
as
file
:
with
open
(
file_path
,
'r'
,
encoding
=
'utf-8'
)
as
file
:
data
=
json
.
load
(
file
)
data
=
json
.
load
(
file
)
print
(
f
"
QR_v1.4
데이터 개수:
{
len
(
data
)
}
개"
)
print
(
f
"
{
file_path
.
split
(
'.json'
)[
0
]
}
데이터 개수:
{
len
(
data
)
}
개"
)
```
```
%% Output
%% Output
QR_v1.4 데이터 개수: 9573개
QR_v1.4 데이터 개수: 9573개
%% Cell type:code id: tags:
%% Cell type:code id: tags:
```
python
```
python
```
```
...
...
Write
Preview
Supports
Markdown
0%
Try again
or
attach a new file
.
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment