Academic

예시로 보는 ChatGPT / ChatGPT Pro / Bing / 구글 바드 비교 (feat. 공학 및 프로그래밍 분야에서는 뭐가 좋을까?)

하룻강아지^^ 2023. 6. 23. 17:34
728x90
반응형


요약

  • 대화형 인공지능 서비스를 통해 복잡한 문제의 해답을 구하기에는 아직 부족한게 많은 것 같고, 작업을 수행함에 있어 보조적 도구로 사용하는 것은 충분한 효용이 있다고 판단됩니다.
  • (1) 기능을 제공하는 공학 도구 검색, (2) 검색 내용 일괄 정리, (3) 라이브러리 사용방법 및 예시 검색 등에서는 시간을 상당히 세이브 해줄 수 있다고 생각합니다.
  • 본 게시물은 (1), (2)를 중심으로 정리한 것이고, 개인적인 경험과 한정적인 사례에 기반한 생각이니 다양하게 사용해보시고 판단해보시는 것을 추천드립니다.

 

  • 공학이나 프로그래밍 분야에서 보조적 도구로 사용하는 경우에는 ChatGPT나 ChatGPT Pro가 만족스러웠습니다.
  • ChatGPT나 ChatGPT Pro나 유사한 수준의 효용을 느꼈습니다. (꼭 유료버전인 ChatGPT Pro를 사용할 필요는 없어보입니다.)
  • Bing의 경우 오히려 일상적인 환경이나 오락 측면에서 활용도가 높아보였습니다.
  • 구글 바드의 경우에는 실험버전이기도 하고, 실제로도 나머지에 비해 효용이 크게 떨어지는 느낌입니다.

 

 


배경

공학문제를 해결하기위한 코드를 만들거나 프로그램을 구축할 때에, 처음부터 코딩을 하는 것이 아니라 이미 개발된 오픈소스 패키지 혹은 라이브러리를 활용하는 경우가 많습니다. 이 경우 보통 다음과 같은 절차를 거치게 되는데요.

  1. 오픈소스 라이브러리 후보를 가능한 많이 찾는다.
  2. 라이브러리 별 주요 특성들을 파악하고, 내 문제에 적합하지 않은 것들은 필터링 한다.
  3. 추려진 라이브러리 중심으로 성능확인을 위해 샘플문제 (혹은 밴치마크 문제)를 풀어보고 비교한다.
  4. 사용할 라이브러리를 결정한다.

 

이런 작업을 수행할 때에 얼마나 채팅 기반의 인공지능 서비스가 얼마나 도움이 될지 확인해 보았습니다. 아래 문답은 적합한 라이브러리 후보를 찾기 위한 일련의 문답이라고 보시면 되겠습니다.

아래 질문들을 통해 찾고자 하는 라이브러리는 시뮬레이션 데이터를 기반으로 크리깅 모델을 생성해주는 라이브러리 였습니다. 사실 이미 위의 1~4번 절차를 통해 문제에 적합한 라이브러리를 찾은 상태였습니다. 답을 알고 있는 상태에서 어떤 서비스가 좋은 결과를 내는지 판단해보았습니다.

(1) Chat GPT-3.5, (2) Chat GPT-4.0 또는 Chat GPT 프로, (3) MS Bing에 대해서 동일한 질문을 하고 답변을 비교해 보았습니다. 구글 Bard의 경우에는 답변의 퀄리티가 현저히 부족한 느낌이라, 게시물 마지막에 간단히 정리하였습니다.

 

 

참고 : Surrogate model (대체 모델), Kriging model (크리깅 모델)

  • 대체 모델은 각 분야마다 정의가 약간씩 다르긴 하지만, 실제 복잡하고 얻는데 비용이 많이드는 모델을 대체할 수 있는 모델입니다.
  • 예를들어, 엑셀의 선형 추세선도 대체 모델입니다. 이 추세선(아래 그림 점선)을 통해 실제 데이터가 없는 곳에서도 어느정도 겠거니 예측할 수 있는 것이죠.

 

출처 : https://support.microsoft.com/ko-kr/office/%EC%B0%A8%ED%8A%B8%EC%97%90-%EC%B6%94%EC%84%B8-%EB%98%90%EB%8A%94-%EC%9D%B4%EB%8F%99-%ED%8F%89%EA%B7%A0-%EC%84%A0-%EC%B6%94%EA%B0%80-fa59f86c-5852-4b68-a6d4-901a745842ad

 

  • 즉 실제 데이터를 수집하는 행위 (높은 정확도, 비용 과다)를 대체할 수 있는 대체 모델 (정확도 타협, 경제성 확보)을 통해 모함수를 예측하는 것을 대체 모델링이라고 합니다.
  • 크리깅 모델은 대체 모델의 한 종류입니다.
  • (1) 예측 불확실성에 대한 정량적 값을 얻을 수 있으며, (2) 여러 극값이 혼재한 복잡한 함수 예측에 적합하고, (3) 다변수에도 적용 가능하다는 여러 장점들로 인해 여러 분야에서 활용되고 있습니다.
  • 전체적인 트렌드를 나타내는 global model과 가우시안 분포로 구성된 local deviation의 합으로 예측을 하게 됩니다.
  • 아래 그림에서 파란색으로 표시된 샘플 (Sample)은 실제로는 하나하나 획득하기 매우 어렵거나, 비용이 많이 드는 것들입니다.
  • 추가적인 샘플의 획득없이 기존의 샘플들을 가지고, 샘플이 존재하지 않는 빨간색 선으로 표시된 모함수의 값을 예측하는 방식이라고 보면 되겠습니다.

 

출처 : Surrogate Model based Sensitivity Analysis and Design Study for High Efficiency Hypersonic Wind Tunnel Diffuser = 고 효율 극초음속 풍동 디퓨저에 대한 대체 모델 기반의 민감도 분석 및 설계연구, 최대산, 학위논문(박사), 서울대학교 항공우주공학과 우주항공공학, 2023. 2.

 

 


문답

질문 1 : kriging model과 같은 surrogate model을 생성할 수 있는 파이썬 라이브러리나 패키지가 있을까?

 

GPT-3.5

 

네, 파이썬에서는 다양한 surrogate model을 생성할 수 있는 라이브러리와 패키지가 있습니다. Kriging 모델 또는 Gaussian Process 모델은 surrogate model의 일종으로 많이 사용됩니다. 몇 가지 주요한 라이브러리와 패키지를 소개해드리겠습니다:

1. Scikit-learn: Scikit-learn은 머신 러닝을 위한 파이썬 라이브러리로, Gaussian Process Regression을 포함한 다양한 surrogate model을 지원합니다. GaussianProcessRegressor 클래스를 사용하여 Gaussian Process 모델을 생성하고 사용할 수 있습니다.

2. GPy: GPy는 Gaussian Process 모델링을 위한 파이썬 라이브러리로, Gaussian Process Regression 및 다양한 확률적 모델링 기법을 제공합니다. 다양한 covariance 함수와 확률분포 모델링 옵션을 사용하여 surrogate model을 구성할 수 있습니다.

3. pyKriging: pyKriging은 Kriging 모델링을 위한 파이썬 패키지로, Kriging surrogate model을 구축하고 최적화 문제를 해결하는 데 사용됩니다. pyKriging은 주어진 입력-출력 데이터를 기반으로 Kriging 모델을 적합시키고, 최적화 및 예측 기능을 제공합니다.

4. Emukit: Emukit은 다양한 surrogate model 및 목적 함수 최적화를 위한 오픈 소스 파이썬 라이브러리입니다. Gaussian Process, Random Forest, Bayesian Neural Network 등 다양한 surrogate model을 지원하며, 목적 함수의 평가 및 최적화에 사용될 수 있습니다.

이 외에도 더 많은 라이브러리와 패키지가 있으며, surrogate model을 생성하고 활용할 수 있는 다양한 기능을 제공합니다. 선택한 surrogate model의 특성, 사용법, 성능 등을 고려하여 적합한 라이브러리나 패키지를 선택하시면 됩니다.

 

 

GPT-4.0

 

네, 파이썬에서 kriging 모델을 생성하고 사용하는 데 도움이 될 수 있는 여러 라이브러리와 패키지가 있습니다. Kriging은 주로 지질 통계, 산업공학, 환경 공학 등의 분야에서 널리 사용되는 고급 통계적 방법론입니다. 

1. **PyKrige**: 이것은 파이썬에서 kriging을 구현하기 위한 주요 라이브러리 중 하나입니다. Ordinary Kriging, Universal Kriging, Co-Kriging 등 다양한 kriging 방법을 지원합니다.

2. **scikit-learn**: scikit-learn 라이브러리는 Gaussian Process Regression (GPR) 모듈을 제공하며, 이는 Kriging을 위한 좋은 방법입니다. Kriging은 사실 가우스 프로세스의 일종이기 때문에, scikit-learn의 GPR을 사용하여 Kriging 문제를 해결할 수 있습니다.

3. **GPy**: 이 라이브러리는 파이썬에서 가우스 프로세스 모델링을 위한 라이브러리입니다. Kriging과 비슷한 기능을 제공하며, 많은 사용자 정의 가능성과 더욱 고급 기능을 제공합니다.

4. **GPflow**: 이것은 텐서플로우를 기반으로 하는 가우시안 프로세스 모델링 라이브러리입니다. 이 라이브러리는 GPy와 유사한 기능을 제공하지만, 텐서플로우의 강력한 연산 엔진과 GPU 가속 기능을 활용할 수 있다는 점에서 차이가 있습니다.

이러한 라이브러리들을 통해 다양한 kriging 모델을 생성하고 적합시키는데 사용할 수 있습니다. 다만, 각 라이브러리의 API와 사용법은 상이하므로 공식 문서를 참고하여 사용해야 합니다.

 

 

Bing

 

네, 파이썬에서는 Kriging surrogate model을 생성할 수 있는 여러 라이브러리와 패키지가 있습니다. 예를 들어, **kriging** 라이브러리는 Kriging surrogate model을 생성하는 파이썬 도구입니다¹. 또한 **smt** 패키지는 surrogate modeling methods, sampling techniques, and benchmarking functions을 포함하는 Python package입니다²³. 이 패키지는 사용하기 쉬운 surrogate models library를 제공하며 추가적인 방법의 구현을 용이하게 합니다.

출처: Bing과의 대화, 2023. 6. 8.(1) GitHub - evanchodora/kriging: Python tool for creating Kriging surrogate models. https://github.com/evanchodora/kriging 액세스한 날짜 2023. 6. 8..
(2) smt · PyPI. https://pypi.org/project/smt/ 액세스한 날짜 2023. 6. 8..
(3) GitHub - SMTorg/smt: Surrogate Modeling Toolbox. https://github.com/SMTorg/smt 액세스한 날짜 2023. 6. 8..

 

 

질문 2 : 좀 더 리스트업 해줘

 

GPT-3.5

 

물론입니다! Surrogate model 생성을 위한 더 많은 파이썬 라이브러리와 패키지를 아래에 리스트업했습니다:

1. GPyOpt: GPyOpt은 Bayesian Optimization을 위한 Gaussian Process 모델을 구축하는 데 사용되는 파이썬 라이브러리입니다. Surrogate model을 활용하여 목적 함수를 모델링하고, 최적화 문제를 해결하는 데에 사용됩니다.

2. PySOT: PySOT (Python Surrogate Optimization Toolbox)은 surrogate model을 사용하는 목적 함수 최적화를 위한 라이브러리입니다. Gaussian Process, Kriging, RBF 등의 surrogate model을 지원하며, 수렴 속도와 샘플 효율성을 향상시키는 기능을 제공합니다.

3. SMAC: SMAC (Sequential Model-based Algorithm Configuration)은 Bayesian Optimization을 기반으로 하는 목적 함수 최적화 도구입니다. Surrogate model을 사용하여 목적 함수의 평가를 줄이고, 효율적으로 최적해를 찾을 수 있습니다.

4. DiceOptim: DiceOptim은 수학적 모델링을 위한 라이브러리로, Gaussian Process Regression을 사용한 surrogate model을 생성하고 목적 함수를 최적화하는 데에 사용됩니다.

5. RBF-SM: RBF-SM (Radial Basis Function Surrogate Model)은 Radial Basis Function을 사용하여 surrogate model을 생성하는 라이브러리입니다. RBF-SM을 사용하여 최적화 문제를 해결하고 목적 함수를 모델링할 수 있습니다.

6. Dlib: Dlib은 머신 러닝 및 최적화 알고리즘을 위한 범용 C++ 라이브러리이며, 파이썬에서도 사용할 수 있습니다. Gaussian Process, Radial Basis Function 등의 surrogate model을 생성하고 사용할 수 있는 기능을 제공합니다.

이러한 라이브러리와 패키지는 surrogate model을 생성하고 최적화 문제를 해결하는 데에 사용됩니다. 사용 목적과 필요한 기능에 따라 적합한 라이브러리를 선택하여 활용하시면 됩니다.

 

 

GPT-4.0

 

물론입니다. Kriging을 위한 파이썬 라이브러리와 패키지는 다양하며, 사용자의 필요에 맞게 선택할 수 있습니다. 추가적으로는 다음과 같은 라이브러리가 있습니다:

5. **GeostatsPy**: GeostatsPy는 기본적인 지오스태티스틱스 작업을 위한 함수를 제공하며, 이에는 Kriging이 포함되어 있습니다. 이 라이브러리는 다소 기본적이지만, 이해하고 사용하기 쉽습니다.

6. **gstools**: gstools 라이브러리는 다양한 geostatistical tools를 제공하는데, 이는 Kriging, Random Fields, Variogram Estimation 등을 포함합니다.

7. **pysal**: PySAL은 공간 분석을 위한 강력한 라이브러리입니다. PySAL의 esda 모듈은 지오스태티스틱스와 Kriging에 사용할 수 있습니다.

8. **RPyGeo**: 이것은 R의 geostatistical 패키지를 파이썬에서 사용할 수 있게 하는 인터페이스입니다. R의 gstat 패키지 같은 것을 사용하여 Kriging을 수행할 수 있습니다.

9. **pyGIMLi**: pyGIMLi는 Geophysical Inversion and Modelling Library의 파이썬 구현입니다. 이 라이브러리는 Kriging 뿐만 아니라 여러 가지 지질물리학적 분석 기능을 제공합니다.

10. **scipy**: scipy 라이브러리의 interpolate 서브모듈에는 Rbf라는 함수가 있는데, 이는 Radial basis function interpolation을 수행합니다. 이것은 Kriging과 비슷한 기능을 수행하며, 공간 데이터를 보간하는데 사용할 수 있습니다.

이 라이브러리들 모두 Kriging 또는 Kriging과 비슷한 기능을 제공하며, 문제의 특성과 필요에 따라 선택하면 됩니다. 각 라이브러리의 API, 기능, 사용법 등은 공식 문서를 참고해주세요.

 

 

Bing

 

네, 파이썬에서는 surrogate model을 생성할 수 있는 여러 라이브러리와 패키지가 있습니다. 예를 들어, **smt** 패키지는 surrogate modeling methods, sampling techniques, and benchmarking functions을 포함하는 Python package입니다¹²³. 이 패키지는 사용하기 쉬운 surrogate models library를 제공하며 추가적인 방법의 구현을 용이하게 합니다.

출처: Bing과의 대화, 2023. 6. 8.(1) smt · PyPI. https://pypi.org/project/smt/ 액세스한 날짜 2023. 6. 8..
(2) GitHub - SMTorg/smt: Surrogate Modeling Toolbox. https://github.com/SMTorg/smt 액세스한 날짜 2023. 6. 8..
(3) smt 1.3.0 on PyPI - Libraries.io. https://libraries.io/pypi/smt 액세스한 날짜 2023. 6. 8..

 

 

 

질문 3 : 어떤 라이브러리가 가장 사용자가 많을까?

 

GPT-3.5

 

파이썬에서 Surrogate Model을 생성하고 사용하는 라이브러리 중에서 가장 널리 사용되는 몇 가지 라이브러리는 다음과 같습니다:

1. Scikit-learn: Scikit-learn은 다양한 머신 러닝 알고리즘과 도구를 제공하는 파이썬 라이브러리로서 많은 사용자들에게 널리 알려져 있습니다. Gaussian Process를 비롯한 다양한 surrogate model 기능을 제공하며, 사용자 친화적인 API와 다양한 편의 기능으로 인기를 얻고 있습니다.

2. GPy: GPy는 파이썬에서 Gaussian Process 모델링을 위한 전문 라이브러리로서 많은 사용자들이 이용하고 있습니다. 다양한 covariance 함수와 확률분포 모델링 옵션을 제공하며, 고급 Gaussian Process 모델링에 관심 있는 사용자들 사이에서 인기가 있습니다.

3. pyKriging: pyKriging은 Kriging surrogate model을 생성하고 최적화 문제를 해결하기 위한 라이브러리로, Kriging 모델링에 관심 있는 사용자들에게 많이 사용됩니다. 간단한 설치와 사용법, 예측 및 최적화 기능의 편의성이 높은 평가를 받고 있습니다.

4. Emukit: Emukit은 다양한 surrogate model과 목적 함수 최적화를 위한 파이썬 라이브러리로서 점점 더 많은 사용자들에게 인기를 얻고 있습니다. 다양한 surrogate model과 최적화 알고리즘을 포함한 풍부한 기능과 사용자 친화적인 인터페이스를 제공하여 널리 사용되고 있습니다.

물론, 라이브러리의 사용자 인기는 상황에 따라 다를 수 있으며, 실제 사용자 수를 정량적으로 비교하는 것은 어려운 점을 감안해야 합니다. 하지만 위에 언급된 라이브러리들은 Surrogate Model을 생성하는 데에 널리 사용되고 있는 것으로 알려져 있습니다.

 

 

GPT-4.0

 

사용자 수와 인기를 기준으로 볼 때, 가장 널리 사용되는 라이브러리는 "scikit-learn" 및 "PyKrige"가 될 것입니다.

1. **scikit-learn**: 이 라이브러리는 파이썬에서 가장 인기 있는 머신러닝 라이브러리 중 하나입니다. Gaussian Process Regression (GPR) 모듈은 Kriging과 같은 일련의 통계적 추정 작업에 유용하게 사용됩니다. Scikit-learn의 강력한 기능, 활발한 커뮤니티 지원, 그리고 광범위한 사용 사례로 인해 많은 사용자들이 이 라이브러리를 선호합니다.

2. **PyKrige**: 이 라이브러리는 kriging에 특화되어 있으며 다양한 kriging 기법을 지원합니다. PyKrige는 특히 Kriging에 초점을 맞춘 패키지로서, 해당 분야의 전문적인 수행력으로 인해 많은 사용자가 이용하고 있습니다.

다른 라이브러리들도 각각의 특성에 맞게 사용되고 있지만, 사용자의 수와 관련된 정보는 직접적으로 측정하기 어렵고 종종 이러한 패키지들의 인기도나 활동도를 나타내는 대표적인 지표가 되기도 합니다. 이들 간의 선택은 개인의 프로젝트 요구사항, 코드베이스의 호환성, 그리고 개인적인 취향에 따라 달라질 수 있습니다.

 

 

Bing

 

smt 패키지가 가장 많이 사용되는 surrogate model 라이브러리 중 하나입니다¹²³. 이 패키지는 surrogate modeling methods, sampling techniques, and benchmarking functions을 포함하는 Python package입니다. 이 패키지는 사용하기 쉬운 surrogate models library를 제공하며 추가적인 방법의 구현을 용이하게 합니다.

출처: Bing과의 대화, 2023. 6. 8.(1) smt · PyPI. https://pypi.org/project/smt/ 액세스한 날짜 2023. 6. 8..
(2) GitHub - SMTorg/smt: Surrogate Modeling Toolbox. https://github.com/SMTorg/smt 액세스한 날짜 2023. 6. 8..
(3) A Python surrogate modeling framework with derivatives. https://www.sciencedirect.com/science/article/pii/S0965997818309360 액세스한 날짜 2023. 6. 8..

 

 

질문 4 : github 등에서 star나 fork 숫자를 체크하면 확인할 수 있지 않을까?

 

GPT-3.5

 

예, GitHub에서 star나 fork 숫자를 확인하여 프로젝트의 인기도를 일부 추정할 수 있습니다. 이러한 지표는 사용자들이 프로젝트를 관심을 가지고 참여하거나 지지하는 정도를 나타내는데 사용됩니다.

GitHub에서 각 프로젝트 페이지에 접속하면 해당 프로젝트의 star와 fork 숫자를 확인할 수 있습니다. Star는 사용자들이 프로젝트를 "관심 프로젝트"로 표시한 횟수를 의미하며, Fork는 해당 프로젝트를 사용자들이 자신의 계정으로 복제한 횟수를 의미합니다.

Star와 Fork는 프로젝트의 인기도를 일부로 파악할 수 있지만, 절대적인 성과나 품질을 반영하는 것은 아닙니다. 따라서, 단지 Star와 Fork 숫자만으로 라이브러리나 프로젝트의 사용자 인기도를 평가하는 것은 정확한 지표로서 활용하기에는 한계가 있습니다.

GitHub에서는 또한 프로젝트의 Issue, Pull Request, Contributor 등의 활동 수준도 확인할 수 있습니다. 이러한 지표들을 함께 고려하여 프로젝트의 활발성과 지속성을 파악할 수 있습니다. 또한, 프로젝트의 README 파일, 라이선스, 문서화 수준, 업데이트 주기 등을 검토하여 프로젝트의 신뢰성과 품질을 평가하는 것도 중요합니다.

 

 

GPT-4.0

 

그렇습니다, GitHub의 star와 fork 수는 해당 라이브러리나 프로젝트의 인기도와 커뮤니티 활성도를 나타내는 지표로 널리 사용됩니다. 높은 star 수는 많은 사용자가 해당 프로젝트를 알고 있으며, 그것이 유용하다고 인정한다는 것을 의미합니다. 또한 높은 fork 수는 사용자들이 해당 프로젝트를 자신들의 작업에 적용하려고 노력하고 있다는 것을 보여줍니다.

그러나 이러한 지표들은 단순히 인기도만을 반영하며, 특정 라이브러리가 특정 작업에 최적화되어 있거나, 특정 필요를 충족시키는 능력에 대해 반영하지는 않습니다. 따라서 이러한 지표들을 참고하여 라이브러리를 선택할 때는 그들이 실제로 프로젝트 요구사항을 충족시키는지를 반드시 고려해야 합니다.

결국, 여러가지 요인을 종합적으로 고려하는 것이 중요합니다: star와 fork의 수, 라이브러리의 기능, 커뮤니티의 활성도, 공식 문서의 품질, 라이브러리의 업데이트 빈도 등이 그런 요인들에 해당합니다.

 

 

Bing

 

네, 그렇습니다. star나 fork 숫자를 체크하면 가장 많이 사용되는 라이브러리를 확인할 수 있습니다. 예를 들어, **smt** 패키지는 GitHub에서 1.2k개의 star와 0.5k개의 fork를 받았습니다. 이는 많은 사용자들이 이 패키지를 사용하고 있다는 것을 보여줍니다.

 

 

 

질문 5 : 위에서 열거한 라이브러리의 github의 star나 fork 수를 알려줘

 

GPT-3.5

 

저는 현재 실시간 데이터에 접근할 수 없기 때문에, 최신의 GitHub star나 fork 수를 알려드릴 수는 없습니다. GitHub에서는 각 라이브러리의 GitHub 저장소에 접속하여 해당 정보를 확인하실 수 있습니다.

각 라이브러리의 GitHub 저장소는 다음과 같습니다:

1. Scikit-learn: https://github.com/scikit-learn/scikit-learn
2. GPy: https://github.com/SheffieldML/GPy
3. pyKriging: https://github.com/capaulson/pyKriging
4. Emukit: https://github.com/amzn/emukit

GitHub 저장소에서는 저장소 상단에 있는 "Star" 버튼을 클릭하여 star 수를 확인하실 수 있습니다. 또한, 저장소 우측 상단의 "Fork" 버튼을 클릭하여 fork 수를 확인하실 수 있습니다.

GitHub의 star와 fork 수는 상시로 변동되므로, 저는 현재 숫자를 제공할 수 없으며, 직접 해당 GitHub 저장소를 방문하여 최신 정보를 확인하시기를 권장합니다.

 

 

GPT-4.0

 

죄송합니다. 현재의 AI 모델, GPT-4의 지식 베이스는 2021년 9월까지로 제한되어 있으며, 실시간 데이터에 대한 정보는 제공하지 못합니다. 이러한 정보는 각 프로젝트의 GitHub 페이지에 직접 방문하여 확인하실 수 있습니다. 

GitHub에서 프로젝트를 검색하려면, 일반적으로 "프로젝트명 GitHub"라고 검색하시면 됩니다. 그런 다음 GitHub 페이지로 이동하여 상단에 있는 star와 fork 수를 확인하실 수 있습니다. 

다음은 각 라이브러리의 GitHub 페이지로 이동할 수 있는 링크입니다 (2021년 9월 기준):

 

1. scikit-learn

2. PyKrige

3. GPy

4. GPflow

5. GeostatsPy

6. gstools

7. pysal

8. RPyGeo

9. pyGIMLi

10. scipy

 

이 정보를 바탕으로 각 라이브러리의 현재 star와 fork 수를 확인하시기 바랍니다.

 

 

Bing

 

네, **smt** 패키지는 GitHub에서 1.2k개의 star와 0.5k개의 fork를 받았습니다. 이는 많은 사용자들이 이 패키지를 사용하고 있다는 것을 보여줍니다.

 

   추가 질문 : smt 말고 다른 라이브러리도 github에서의 star와 fork를 알려줘

 

smt 패키지 외에도 surrogate model 라이브러리 중에서는 **surrogate-models**가 있습니다. 이 패키지는 Python asynchronous optimization global-optimization black-box-optimization gaussian-processes bayesian-optimization radial-basis-function global-optimization-algorithms surrogate-models surrogate-based-optimization을 포함합니다. 이 패키지는 57개의 star를 받았습니다². 또한 **surrogate-based-optimization** 패키지도 있습니다. 이 패키지는 Implementation of the PAMELI algorithm for computationally expensive multi-objective optimization. evolutionary-algorithms meta-heuristic multi-objective-optimization surrogate-based-optimization expensive-cost-functions을 포함합니다. 이 패키지는 1개의 star를 받았습니다³.

출처: Bing과의 대화, 2023. 6. 8.(1) surrogate-models · GitHub Topics · GitHub. https://github.com/topics/surrogate-models 액세스한 날짜 2023. 6. 8..
(2) surrogate-based-optimization · GitHub Topics · GitHub. https://github.com/topics/surrogate-based-optimization?o=asc&s=stars 액세스한 날짜 2023. 6. 8..
(3) GitHub - SMTorg/smt: Surrogate Modeling Toolbox. https://github.com/SMTorg/smt 액세스한 날짜 2023. 6. 8..

 

 

질문 6 : 그럼 위에서 열거한 라이브러리 중에서 3개 이상의 다변수에 적용 가능한 라이브러리만 추려줄 수 있을까?

 

GPT-3.5

 

네, 다변수 최적화에 적용 가능한 라이브러리로는 Scikit-learn, GPy, Emukit 등이 있습니다. pyKriging은 다변수 최적화에도 사용될 수 있지만, 몇 가지 제한적인 기능이 있을 수 있습니다. 따라서, 아래에 3개 이상의 다변수 최적화에 적용 가능한 라이브러리를 추려보았습니다:

1. Scikit-learn: Scikit-learn은 머신 러닝을 위한 포괄적인 라이브러리로, 다양한 회귀, 분류, 군집화 등의 알고리즘을 포함하고 있습니다. 다변수 최적화 문제를 해결하기 위해 함수의 입력 변수를 다차원 배열로 정의하여 사용할 수 있습니다.

2. GPy: GPy는 Gaussian Process 모델링을 위한 파이썬 라이브러리로, 다변수 입력 변수에 대한 surrogate model을 생성할 수 있습니다. GPy는 다양한 covariance 함수를 지원하며, 다변수 최적화 문제에 활용할 수 있습니다.

3. Emukit: Emukit은 다양한 surrogate model 및 목적 함수 최적화를 위한 파이썬 라이브러리입니다. Emukit은 Gaussian Process, Random Forest, Bayesian Neural Network 등 다양한 surrogate model을 지원하며, 다변수 최적화 문제에 적용할 수 있습니다.

이 라이브러리들은 다변수 최적화에 활용될 수 있는 다양한 기능과 도구를 제공하고 있습니다. 사용 목적과 요구사항에 따라 적절한 라이브러리를 선택하여 활용하시면 됩니다.

 

 

GPT-4.0

 

다변수 (또는 다변량) 데이터에 적용 가능한 Kriging 혹은 Kriging과 유사한 기능을 제공하는 라이브러리는 다음과 같습니다:

1. **scikit-learn**: scikit-learn의 Gaussian Process 모델은 다변수 입력에 대해 매우 잘 작동합니다. 이 라이브러리는 여러 입력 변수를 쉽게 다룰 수 있게 해주며, 커널 선택에 따라 다양한 Kriging 모델을 만들 수 있습니다.

2. **GPy**: 이 라이브러리는 여러 입력 변수를 가진 가우시안 프로세스 모델을 만드는 데 유용합니다. 다양한 커널을 사용하여 복잡한 다변수 Kriging 모델을 구성할 수 있습니다.

3. **GPflow**: 이 라이브러리는 텐서플로우 기반의 가우시안 프로세스 모델링 라이브러리로, 다변수 데이터에 대한 Kriging을 지원합니다. 많은 유연성과 GPU 가속 기능을 제공하므로, 복잡하고 컴퓨팅 집약적인 문제에 잘 적합합니다.

이 3개 라이브러리는 모두 다변수 입력을 지원하며, 각자 다양한 유연성과 기능을 가지고 있습니다. 각 라이브러리의 API와 사용법은 서로 다르므로, 공식 문서와 관련 자료를 참고하면서 프로젝트에 가장 적합한 라이브러리를 선택해야 합니다.

 

 

Bing

 

smt 패키지 외에도 surrogate model 라이브러리 중에서는 **surrogate-models**가 있습니다. 이 패키지는 Python asynchronous optimization global-optimization black-box-optimization gaussian-processes bayesian-optimization radial-basis-function global-optimization-algorithms surrogate-models surrogate-based-optimization을 포함합니다. 이 패키지는 19개의 star를 받았습니다². 또한 **pySOT** 패키지도 있습니다. 이 패키지는 Python Surrogate Optimization Toolbox입니다. 이 패키지는 an asynchronous parallel optimization toolbox for computationally expensive global optimization problems을 포함합니다. 이 패키지는 1개의 star를 받았습니다³.

출처: Bing과의 대화, 2023. 6. 8.(1) surrogate-models · GitHub Topics · GitHub. https://github.com/topics/surrogate-models?l=python&o=asc&s=stars 액세스한 날짜 2023. 6. 8..
(2) GitHub - dme65/pySOT: Surrogate Optimization Toolbox for Python. https://github.com/dme65/pySOT 액세스한 날짜 2023. 6. 8..
(3) GitHub - SMTorg/smt: Surrogate Modeling Toolbox. https://github.com/SMTorg/smt 액세스한 날짜 2023. 6. 8..

 

   추가 질문 : fork 숫자를 물어본게 아니라, surrogate model을 생성할 수 있는 파이썬 라이브러리 중에서 3개 이상의 다변수에 적용 가능한 것들만 추려줄 수 있는지 물어봤어

 

죄송합니다. 이전에 제가 드린 답변이 원하시는 답변이 아니었군요. surrogate model을 생성할 수 있는 파이썬 라이브러리 중에서 3개 이상의 다변수에 적용 가능한 것들만 추려드리겠습니다. **surrogate-models** 패키지는 다변수 surrogate model을 생성할 수 있습니다. 또한 **pySOT** 패키지도 다변수 surrogate model을 생성할 수 있습니다. 마지막으로 **GPyOpt** 패키지도 다변수 surrogate model을 생성할 수 있습니다. 이 세 가지 라이브러리를 추천해드립니다.

 

   추가 질문 : 방금 말한 surrogate-models 패키지의 홈페이지 링크를 알려줘

 

**surrogate-models** 패키지의 홈페이지 링크는 다음과 같습니다: https://github.com/SMTorg/smt

 

 

 


기타 : 결과물 정리

위 결과물을 표로 정리해주라는 요청에 대해 모든 서비스가 만족스럽게 정리해 주었습니다.

예를들어, 아래는 Chat GPT-3.5에게 요청한 결과입니다. 더 갯수를 늘려서 정리해주라고 요청하면 라이브러리 개수를 늘려줍니다.

 

 

 

 


기타 : 구글 Bard 는 어떨까?

아래와 같이 질문이 좀 더 고도화 되거나 이어지게 되면 만족할만한 답을 얻을 수 없었습니다. 질문 3에서 부터 적합한 답변을 얻을 수 없었고, 추가 질문을 통해 적절한 답변을 유도했음에도 불구하고 만족스러운 답변을 얻을 수 없었습니다. 구글 Bard는 현재 베타 테스트 중이라는 것을 명시하고 있습니다.

 

질문 1 : kriging model과 같은 surrogate model을 생성할 수 있는 파이썬 라이브러리나 패키지가 있을까?

 

네, 크리깅 모델과 같은 대리 모델을 생성할 수 있는 파이썬 라이브러리 및 패키지가 많이 있습니다. 다음은 몇 가지 인기 있는 옵션입니다.

  • scikit-learn : scikit-learn은 다양한 머신 러닝 알고리즘을 포함하는 오픈 소스 라이브러리입니다. 여기에는 크리깅을 포함하여 대리 모델을 생성하는 데 사용할 수 있는 여러 기능이 포함되어 있습니다.
  • GPy : GPy는 Gaussian process 모델을 생성하고 최적화하는 데 사용할 수 있는 파이썬 라이브러리입니다. 크리깅은 Gaussian process 모델의 한 유형입니다.
  • PyMC3 : PyMC3는 Bayesian 통계 모델을 생성하고 최적화하는 데 사용할 수 있는 파이썬 라이브러리입니다. 크리깅은 Bayesian 통계 모델의 한 유형입니다.

이러한 라이브러리 및 패키지는 모두 무료로 사용할 수 있으며 파이썬 패키지 인덱스에서 찾을 수 있습니다.

크리깅 모델을 생성하기 위해 이러한 라이브러리 중 하나를 사용하는 방법에 대한 자세한 내용은 해당 라이브러리의 문서를 참조하십시오.

 

 

질문 2 : 좀 더 리스트업 해줘

 

물론입니다. 크리깅 모델을 생성할 수 있는 파이썬 라이브러리 및 패키지는 다음과 같습니다.

  • scikit-learn
  • GPy
  • PyMC3
  • Bayesian-optimization
  • TunOpt
  • Spearmint
  • MOE-Opt
  • SMAC
  • HyperOpt
  • Optuna

이러한 라이브러리 및 패키지는 모두 무료로 사용할 수 있으며 파이썬 패키지 인덱스에서 찾을 수 있습니다.

크리깅 모델을 생성하기 위해 이러한 라이브러리 중 하나를 사용하는 방법에 대한 자세한 내용은 해당 라이브러리의 문서를 참조하십시오.

 

 

질문 3 : 어떤 라이브러리가 가장 사용자가 많을까?

 

가장 사용자가 많은 라이브러리는 Google Play 스토어입니다. Google Play 스토어는 안드로이드 사용자에게 앱, 게임, 음악, 영화, 책, 전자책, 잡지, 뉴스 등 다양한 콘텐츠를 제공하는 앱 마켓입니다. 2023년 1월 기준으로 Google Play 스토어의 월간 활성 사용자 수는 20억 명이 넘습니다.

 

   추가 질문 : 아까 말했던 파이썬 라이브러리 중에서 어떤 라이브러리가 가장 사용자가 많을까?

 

네, 아까 말한 파이썬 라이브러리 중에서 가장 사용자가 많은 라이브러리는 pandas입니다. pandas는 데이터 분석을 위한 파이썬 라이브러리로, 데이터를 처리하고 시각화하는 데 사용됩니다. pandas는 2008년에 처음 출시되었으며, 현재 전 세계적으로 수백만 명의 사용자가 사용하고 있습니다. pandas는 데이터 분석 분야에서 가장 인기 있는 라이브러리 중 하나이며, 많은 기업과 연구기관에서 사용되고 있습니다. pandas는 사용하기 쉽고 강력한 라이브러리로, 데이터 분석을 위한 필수 도구로 자리 잡고 있습니다.

 

 

 


조금이나마 도움이 되었으면 좋겠습니다!

이 이미지도 채팅 기반 AI (Bing, DALL-E)로 생성한 것입니다.

728x90
반응형