본문 바로가기
728x90
반응형

분류 전체보기185

[Flutter] STT(Speech to text) 구현하기 이번 포스팅에서는 flutter에서 라이브러리를 사용해 STT(speech to text) 기능을 구현해볼겁니다. 해당 코드는 Flutter Dev 사이트를 참고하여 직접 테스트 해보고 가져왔습니다. 먼저 stt 기능을 사용하기 위해 flutter에서 제공하는 stt 라이브러리를 가져옵니다! pubspec.yaml 파일 내 dependencies 에 라이브러리를 추가해줍니다. dependencies: flutter: sdk: flutter #stt, tts speech_to_text: ^6.1.1 flutter_tts: ^3.6.3 본 포스팅에서는 stt.dart 파일과 생성하여 기능을 넣어주었습니다. 화면단은 모양을 이렇게 잡아줍니다. @override Widget build(BuildContext c.. 2023. 3. 14.
[머신러닝] 과대적합 vs 과소적합 과대적합(overfitting) 과대적합은 모델의 훈련 세트 성능이 테스트 세트 성능보다 훨신 높을 때 일어납니다. 과대적합이란 머신러닝 모델을 학습할 때 훈련 데이터셋에 지나치게 최적화하여 발생하는 문제입니다. 과대적합 발생 원인은 - 훈련 데이터를 지나치게 복잡하게 학습 - 데이터 셋 내 데이터가 충분치 못함 - 데이터 셋 내 분산이 크거나 노이즈가 심한 경우 이런 경우 모델은 훈련 세트 내 모든 데이터를 섭렵하여 오차를 줄이려 하므로 학습 데이터 셋에서는 모델 성능이 높게 나타나지만 새로운 데이터가 들어오면 낮은 정확도를 보여줍니다. 모델을 학습시킬 때 어느 순간 이후로 모델의 훈련세트에 대한 손실 값은 작아지고 검증 세트에 대한 손실값이 커진다면 이는 훈련세트에 밀착하여 모델이 학습하고 있다는 것.. 2023. 3. 13.
[python] reshape() 메서드와 예제 개발 환경 --------------------------------- OS : Mac 개발 툴 : colab 개발 언어 : python --------------------------------- 이번 포스팅은 reshape() 메서드를 공부해보겠습니다. 파이썬 언어는 신기한게 많습ㄴ디ㅏ... reshape() 메서드는 Numpy 패키지에서 제공하는 메서드입니다. 배열의 크기를 바꿀 수 있습니다. 예를들어 import numpy as np test_arr = np.array([1,2,3,4]) test_arr라는 이름의 (4,) 배열이 있습니다. test_arr은 1차원 배열입니다. reshape() 메서드를 사용해 2차원 배열로 변형시키겠습니다. 1. (2,2)로 바꿔볼거에요. import numpy.. 2023. 3. 13.
[머신러닝] 데이터 전처리 개념과 예제 #2 개발 환경 --------------------------------- OS : Mac 개발 툴 : colab 개발 언어 : python --------------------------------- 지난 포스팅에 이어 데이터 전처리 예제를 다뤄보겠다. https://jpointofviewntoe.tistory.com/13 표준편차와 표준점수를 계산해보자 계산하는 방법은 데이터에서 평균을 빼고 표준편차를 나누어주면 된다. np.mean() 함수는 평균을 계산하고 np.std() 함수는 표준편차를 계산한다. 특성마다 값의 스케일이 다를 경우엔 평균과 표준편차를 각 특성별로 계산해야한다. 이를 위해 axis = 0 으로 셋팅했다. 이렇게 하면 행을 따라 열의 통계값을 셋팅한다. mean = np.mean(tr.. 2023. 3. 12.
[머신러닝] 데이터 전처리 개념과 예제 #1 개발 환경 --------------------------------- OS : Mac 개발 툴 : colab 개발 언어 : python --------------------------------- 올바른 결과 도출을 위해서 데이터를 사용하기 전에 데이터 전처리 과정을 거쳐야한다. 데이터 전처리란 데이터를 분석 및 처리에 적합한 형태로 만드는 과정을 총칭한다. 데이터 전처리 단계 데이터 수집 – > 데이터 정제 -> 데이터 통합 -> 데이터 축소 -> 데이터 변환의 가정을 거치게 된다. 데이터 전처리를 해야하는 이유 대부분의 머신러닝 알고리즘은 특성의 스케일이 다르면 잘 작동하지 않는다. 특히 알고리즘이 거리기반일 때는 올바르게 예측하기가 어렵다. k-최근접 이웃 알고리즘도 마찬가지이다. 이런 알고리즘은.. 2023. 3. 12.
[python] np.random.seed 란? 개발 환경 --------------------------------- OS : Mac 개발 툴 : colab 개발 언어 : python --------------------------------- 이번 포스팅에서는 np.random.seed에 대해 보겠다. np.random.seed를 검색해서 들어왔으면 np를 알겠지만 혹시나 모르는 사람이 있을 수 있으니! np는 numpy를 줄여서 말한다. 아래와 같이 import하여 줄여 np로 사용한다. import numpy as np np.random.seed(0)은 일정한 결과를 얻기 위해 사용한다. 예제 np.random.rand() 에 값을 넣어 난수를 생성해보겠다. np.random.seed() 생략 [첫번째 시도] np.random.rand(10) .. 2023. 3. 11.
[머신러닝]K-최근접 이웃 알고리즘 - 예제 개발 환경 --------------------------------- OS : Mac 개발 툴 : colab 개발 언어 : python --------------------------------- 이번 포스팅에서는 K-최근접 이웃 알고리즘 예제다. 아래 링크는 K-최근접 이웃 알고리즘 개념이다. 한번 읽고 예제를 보는 것이 도움될 것 같다. https://jpointofviewntoe.tistory.com/127 이번 포스팅을 포함하여 한동안은 사이킷 런 패키지에 대한 글을 다룰것이다. k-최근접 이웃 알고리즘은 사이킷런 패키지에서 구현한 KNeighborClassifier 클래스이다. 1. KNeighborClassifier 클래스를 import한다. from sklearn.neighbors impo.. 2023. 3. 10.
K-최근접 이웃 알고리즘 개념 정리하기 K-최근접 이웃(K-Nearest Neighbor)은 머신러닝에서 사용되는 분류(Classification) 알고리즘이며 가장 간단한 머신러닝 알고리즘이다. 훈련 데이터셋을 그냥 저장하는 것이 모델을 만드는 과정의 전부고 유사한 특성을 가진 데이터는 유사한 범주에 속하는 경향이 있다는 가정하에 사용한다 k-최근접 이웃 알고리즘은 n개의 특성을 가진 데이터는 n차원의 공간에 점으로 개념화 할 수 있다. K-최근접 이웃(K-Nearest Neighbor) 그림 예제 간단한 그림을 그려보았다. 그림을 상세히 그리지 않았는데 대충 눈에만 안보이는 x축의 특성 수치와 y축의 특성 수치가 있다고 봅시다. 노랑점과 파랑점으로 표시하여 분류를 나타냈으며 빨간별은 아직 분류가 되지 않은 새로운 데이터이다. k-최근접 이.. 2023. 3. 10.
[머신러닝] 머신러닝에 대한 개념보기 이번 포스팅에서는 머신러닝과 인공 신경망, 딥러닝의 개념에 관해 간단히 정리하려합니다. 수박 겉핥기 식으로,,, 머신러닝(machine learning) 머신러닝은 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야이자 인공지능 하위 분야 중에서 지능을 구현하기 위한 소프트웨어를 담당하는 핵심분야다. 머신러닝과 그 구성요소인 딥러닝, 신경망은 모두 AI의 세부 하위집합이다. AI는 의사 결정과 예측을 수행하기 위해 데이터를 처리한다. AI는 머신러닝 알고리즘으로 데이터를 처리할 뿐 아니라 추가 프로그래밍 없이도 데이터를 학습하면서 지능화한다. 사이킷 런(scikit-learn) 파이썬 기반의 대표적인 머신러닝 라이브러리이며 머신러닝을 위한 다양한 알고리즘, 프.. 2023. 3. 9.
[머신러닝] 맷플롯립 (matplotlib) 사용하기 개발 환경 --------------------------------- OS : Mac 개발 툴 : colab 개발 언어 : python --------------------------------- 머신러닝을 위해 python 언어를 공부하며 python에서 제공하는 데이터분석 관련 패키지들을 사용해보려 합니다. 맷플롯립(matplotlib) 패키지는 파이썬에서 과학계산용 그래프를 그리는 대표적인 패키지입니다. 이번 포스팅에서는 맷플롯립(matplotlib) 패키지를 import하고 scatter() 함수를 사용해보겠습니다. 먼저 산점도를 그릴 데이터를 준비해야합니다. 아래 데이터는 도미의 길이와 무게 데이터이며 첫번째 도미의 길이는 25.4 무게는 242.0으로 보시면 됩니다. bream_length .. 2023. 3. 9.
[머신러닝] 빅데이터란 이번 포스팅 부터는 한동안 머신러닝과 딥러닝에 대해 작성해보려고 합니다. 챗봇에 발을 담궈보니 머신러닝과 딥러닝을 병행하여 공부하면 좋을 것 같습니다. 일단 몇권의 책과 함께 시작하려 합니다.. 이 주제에 관한 포스팅은 제가 본 책들을 기반으로 한 요약 포스팅입니다. 지금 인터넷에 돌아다니는 컨텐츠들은 평생을 다 보아도 볼 수 없을 만큼의 방대한 양이며, '콘텐츠 홍수의 시대'에 우리는 살고 있습니다. 이 시대에 플랫폼 회사들은 사용자의 관심에 기반을 둔 추천 서비스를 운영하지 않으면 수익을 내기 힘든 구조가 되었습니다. 빅데이터란 정확히 어떤 것일까 빅데이터는 조직이 의사결정을 내리고 프로세스와 정책을 향상하며 고객 중심 제품과 서비스, 경험을 구축하는데 사용됩됩니다. 정확히 어떤 기술이냐고 묻는다면 .. 2023. 3. 8.
[java] 코모란(KOMORAN) 설치 및 형태소 분석기 사용하기 --------------------------------- OS : Mac 개발 툴 : intelliJ 개발 언어 : java 개발 프레임워크 : vue3 빌드 도구 : Gradle --------------------------------- 안녕하세요 이번 포스팅에서는 코모란(komoran)을 사용해보겠습니다. 코모란(komoran)은 java 8 기준으로 배포된 java에서 대표적으로 사용되는 형태소 분석기 오픈소스 입니다! 환경준비 1. 코모란(komoran)은 java8을 기준으로 배포되었기 때문에 java8 이전 버전을 사용하시는 분은 java 버전 업그레이드가 필요합니다. java 버전 확인하는 방법은 terminal에서 아래 명령어로 확인하면 됩니다. java -version 2. 코모란(.. 2023. 3. 7.
728x90
반응형