-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
-
17
-
18
-
19
-
20
-
21
-
22
-
23
-
24
-
25
-
26
-
27
-
28
-
29
-
30
-
31
-
32
-
33
-
34
-
35
-
36
-
37
-
38
-
39
-
40
-
41
본문내용
1. 문제 이해
-허프만 코딩은 자료 압축의 가장 오래되고 기초적인 방법중의 하나이며 최소 중복 코딩에 기반 한 알고리즘을 사용 한다 최소 중복 코딩은 문자들이 자료 집합에서 얼마나 자주 발생하는지를 안다면 문자들의 비율에 따라 자주 반복되는 문자들을 더 적은 비트로 부호화 하는 방법이다. 일반적인 경우 한 문자를 표현하기 위해 한 개의 바이트를 사용하나 허프만 코드는 문자 발생 비율에 따라 다른 크기 비트로 표현한다.
임의의 텍스트 파일이 주어지면 허프만 코딩 방법을 이용하여 자료를 압축하며 압축된 파일을 해제하는 프로그램을 작성한다.
<문제 해결을 위한 핵심 포인트 도출>
-자주 반복되는 문자들의 더 적은 비트로 부호화
-허프만 코딩 방법을 이용한 자료 압축과 복원
<문제에서 제시하는 준수 조건 기술>
-허프만 코드로 압축된 파일은 이진 파일로 저장한다.
-허프만 코드로 압축한 파일은 허프만 테이블과 허프만 부호화 코드를 포함한다.
-50,000자, 100,000자 500,000WK 이상의 텍스트 파일을 직접 준비한다.
-여러 가지 텍스트 파일에 대해 압축을 수행하여 파일별 및 평균적인 통계정보
(압축률, 문자당 평균 비트 수, 압축 및 복원 시간 등)를 계산한다.
2. 입력 및 출력 정의
<입력, 내부 및 출력 데이터에 대한 분석>
압축의 경우
-입력: 압축되지 않은 임의의 텍스트 파일
-출력: 허프만 코드로 압축된 파일
-허프만 코딩은 자료 압축의 가장 오래되고 기초적인 방법중의 하나이며 최소 중복 코딩에 기반 한 알고리즘을 사용 한다 최소 중복 코딩은 문자들이 자료 집합에서 얼마나 자주 발생하는지를 안다면 문자들의 비율에 따라 자주 반복되는 문자들을 더 적은 비트로 부호화 하는 방법이다. 일반적인 경우 한 문자를 표현하기 위해 한 개의 바이트를 사용하나 허프만 코드는 문자 발생 비율에 따라 다른 크기 비트로 표현한다.
임의의 텍스트 파일이 주어지면 허프만 코딩 방법을 이용하여 자료를 압축하며 압축된 파일을 해제하는 프로그램을 작성한다.
<문제 해결을 위한 핵심 포인트 도출>
-자주 반복되는 문자들의 더 적은 비트로 부호화
-허프만 코딩 방법을 이용한 자료 압축과 복원
<문제에서 제시하는 준수 조건 기술>
-허프만 코드로 압축된 파일은 이진 파일로 저장한다.
-허프만 코드로 압축한 파일은 허프만 테이블과 허프만 부호화 코드를 포함한다.
-50,000자, 100,000자 500,000WK 이상의 텍스트 파일을 직접 준비한다.
-여러 가지 텍스트 파일에 대해 압축을 수행하여 파일별 및 평균적인 통계정보
(압축률, 문자당 평균 비트 수, 압축 및 복원 시간 등)를 계산한다.
2. 입력 및 출력 정의
<입력, 내부 및 출력 데이터에 대한 분석>
압축의 경우
-입력: 압축되지 않은 임의의 텍스트 파일
-출력: 허프만 코드로 압축된 파일
소개글