# HyFI Test Notebook

This Jupyter Notebook is used to test the HyFI package. It contains examples of how to use the package and how to create a new HyFI model.


In [1]:
from corprep import HyFI


  from .autonotebook import tqdm as notebook_tqdm


## Check Version

Now, let's get the version of the `hyfi` package.


In [2]:
version = HyFI.__version__
print("HyFI version:", version)

HyFI version: 1.21.0


In [8]:
data = HyFI.load_dataframe("/raid/cis/yjlee/workspace/projects/corporate-reputation/workspace/datasets/absa_results/corprep-gpt4-sample.parquet")
data.QUAD_pred[0]

'{"timestamp": "2023-08-03 18:33:50", "parsed": "success", "usage": {"prompt_tokens": 2005, "completion_tokens": 367, "total_tokens": 2372}, "response": [{"company": "카카오톡", "aspect": "management", "aspect_terms": ["규제", "독과점 문제", "공정거래위원회", "독점규제 및 공정거래에 관한 법률", "투명하고 일관된 지침"], "opinion_terms": ["망하게 두는 것이 최선이 아니라는 것", "규모가 작고 시스템적으로 중요하지 않던 시절에는 민간에 맡기고 안 되면 주가가 폭락하고 주주가 야단을 맞으면 대표이사를 교체하는 쪽으로 생각했을 것", "이제는 너무나 커졌다 이제는 국가가  안보 등에 연결된 부분을 일거에 마비시키지 않도록 하는 역할이 필요하다고 주장했다", "시장이 어느 정도 실패한 분야를  검토해서  필요하다면 해야 하는 단계에 있다고 본다", "공정위가 만들어서 개입이 불가피하다며 국제적 여건 등에 맞춰 지침을 준비하는 것이 관건이라고 강조했다"], "sentiment": "negative"}]}'

In [5]:
data.columns

Index(['createdDt', 'newsId', 'siteName', 'boardSection', 'cpName', 'category',
       'lastModifiedDt', 'title', 'writers', 'serviceUrl', 'include_ceo',
       'cleaned_text', 'nouns', 'createdDt_int', 'cluster', 'duplicate',
       'fig_filename', '__index_level_0__', 'QUAD_pred'],
      dtype='object')

In [4]:
# Test expanding $PWD and $USER variables
posix_expr = "The system workspace root is $WORKSPACE_ROOT and the user is $USER."

expanded_expr = HyFI.expand_posix_vars(posix_expr)
print(expanded_expr)

The system workspace root is /raid/cis/yjlee/workspace and the user is yjlee.



## Initialize Project

We'll initialize the project using the `HyFI.initialize` function. The function takes the following parameters:

- `project_name`: Name of the project to use.
- `project_description`: Description of the project that will be used.
- `project_root`: Root directory of the project.
- `project_workspace_name`: Name of the project's workspace directory.
- `global_hyfi_root`: Root directory of the global hyfi.
- `global_workspace_name`: Name of the global hierachical workspace directory.
- `num_workers`: Number of workers to run.
- `logging_level`: Log level for the log.
- `autotime`: Whether to automatically set time and / or keep track of run times.
- `retina`: Whether to use retina or not.
- `verbose`: Enables or disables logging

We'll check if we're running in Google Colab, and if so, we'll mount Google Drive.


In [9]:
if HyFI.is_colab():
    HyFI.mount_google_drive()

h = HyFI.initialize(
    project_name="hyfi",
    logging_level="INFO",
    verbose=True,
)

print("project_dir:", h.project.root_dir)
print("project_workspace_dir:", h.project.workspace_dir)


INFO:hyfi.utils.notebooks:Google Colab not detected.
INFO:hyfi.utils.notebooks:Extension autotime not found. Install it first.
INFO:hyfi.joblib.joblib:initialized batcher with <hyfi.joblib.batch.batcher.Batcher object at 0x7f37841aae80>
INFO:hyfi.main.config:HyFi project [hyfi] initialized


project_dir: /home/yjlee/.hyfi/projects/hyfi
project_workspace_dir: /home/yjlee/.hyfi/projects/hyfi/workspace


## Compose Configuration

We can use the `HyFI.compose` function to load a configuration file. In this example, we'll use the default configuration by specifying `path=__default__`.


In [None]:
cfg = HyFI.compose("path=__batch__")

## Display Configuration

Now, let's print the loaded configuration using the `HyFI.print` function.


In [None]:
HyFI.print(cfg)

That's it! This example demonstrated the basic usage of the `hyfi_template` package. You can now use this package to manage your own projects and tasks in a structured manner.


In [10]:
data = HyFI.load_dataframe("/raid/cis/yjlee/workspace/projects/corporate-reputation/workspace/datasets/absa_results/corprep-gpt4-sample.parquet")
data.QUAD_pred[0]

'{"timestamp": "2023-08-03 18:33:50", "parsed": "success", "usage": {"prompt_tokens": 2005, "completion_tokens": 367, "total_tokens": 2372}, "response": [{"company": "카카오톡", "aspect": "management", "aspect_terms": ["규제", "독과점 문제", "공정거래위원회", "독점규제 및 공정거래에 관한 법률", "투명하고 일관된 지침"], "opinion_terms": ["망하게 두는 것이 최선이 아니라는 것", "규모가 작고 시스템적으로 중요하지 않던 시절에는 민간에 맡기고 안 되면 주가가 폭락하고 주주가 야단을 맞으면 대표이사를 교체하는 쪽으로 생각했을 것", "이제는 너무나 커졌다 이제는 국가가  안보 등에 연결된 부분을 일거에 마비시키지 않도록 하는 역할이 필요하다고 주장했다", "시장이 어느 정도 실패한 분야를  검토해서  필요하다면 해야 하는 단계에 있다고 본다", "공정위가 만들어서 개입이 불가피하다며 국제적 여건 등에 맞춰 지침을 준비하는 것이 관건이라고 강조했다"], "sentiment": "negative"}]}'