TRỢ LÝ ẢO PYTHON CƠ BẢN

GIỚI THIỆU

Với những người dùng đã sử dụng qua thiết bị nhà thông minh. Thì khái niệm trợ lý ảo sẽ không còn quá xa lạ. Là một công cụ đắc lực giúp cho ngôi nhà trở nên thông minh và hoàn toàn tự động. Không còn phải thực hiện các tác động vật lý. Cũng như hoàn toàn điều khiển với giọng nói.

Nhưng nếu bạn là một người mới. Muốn tìm hiểu về trợ lý ảo và cách tạo ra nó. Thì không thể bỏ qua bài viết ngay sau đây.

Trợ lý ảo đã phát triển thế nào?


Gần đây, Trợ lý ảo đã có được nền tảng chính sau khi Apple tích hợp Trợ lý ảo đáng kinh ngạc nhất - Siri, chính thức là một phần của Apple Inc. Nhưng dòng thời gian của sự tiến hóa vĩ đại nhất bắt đầu từ sự kiện năm 1962 tại Hội chợ Thế giới Seattle nơi IBM trưng bày bộ máy độc đáo gọi là Shoebox. Đó là kích thước thực tế của một hộp đựng giày và có thể thực hiện các chức năng khoa học và có thể nhận biết 16 từ và cũng có thể nói chúng bằng giọng nói dễ nhận biết của con người với 0 đến 9 chữ số.

Sau đó trong giai đoạn những năm 1970, các nhà nghiên cứu tại Đại học Carnegie Mellon ở Pittsburgh, Pennsylvania cùng với sự hỗ trợ của Bộ Quốc phòng Hoa Kỳ và Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến (DARPA) - đã tạo ra chiếc máy Harpy. Nó có thể hiểu gần 1.000 từ, gần bằng từ vựng của một đứa trẻ ba tuổi.

Vào tháng 4 năm 1997, Dragon NataturalSpeaking là phần mềm chỉnh sửa chính tả đầu tiên có thể hiểu khoảng 100 từ và biến nó thành nội dung có thể đọc được. Theo dòng thời gian, xử lý ngôn ngữ tự nhiên và trợ lý ảo được đầu tư nghiên cứu mạnh mẽ, trải qua những cột mốc quan trọng và đạt được thành tựu thông minh như ngày hôm nay.

Kiến thức cần có


-Kiến thức cơ bản về python và cách sử dụng và tải thư viện mới

Xử lý ngôn ngữ tự nhiên (natural language processing - NLP) là một nhánh của trí tuệ nhân tạo tập trung vào các ứng dụng trên ngôn ngữ của con người. Trong trí tuệ nhân tạo thì xử lý ngôn ngữ tự nhiên là một trong những phần khó nhất vì nó liên quan đến việc phải hiểu ý nghĩa ngôn ngữ-công cụ hoàn hảo nhất của tư duygiao tiếp.

Phải nói rằng, sẽ thật tuyệt vời nếu có thể tự mình tạo ra một trợ lý ảo ngay trên chiếc máy tính để bàn hay laptop của mình với các tiện ích đơn giản như:

Do đó, ở trong bài viết này, mình sẽ xây dựng một ứng dụng tiếng việt có khả năng thực hiện tất cả các nhiệm vụ trên. Mình tương tác với trợ lý ảo trên laptop và mình sẽ gọi bạn ấy là Nhật đẹp trai.

Nào chúng ta bắt đầu thôi. Let's go !!!!

https://github.com/minhnhat2002/trolyao-trochoidoanso

Nguyên liệu cần chuẩn bị

pip install SpeechRecognition

pip install wikipedia

pip install playsound

pip install opencv-python

pip install pyttsx3

pip install PythonTurtle 

pip install gtts


pip install pyaudio

   Sourch Code:https://github.com/minhnhat2002/trolyao-trochoidoanso


Đầu tiên ta khởi tạo đối tượng để phát âm thanh máy, tôi chọn nữ mà đối tượng là nhat 

nhat=pyttsx3.init()

voice=nhat.getProperty('voices')

nhat.setProperty('voice',voice[1].id) #void[0].id là nam ngược lại là nữ



def speak(audio):

    print('Nhat: ' + audio)

    nhat.say(audio)

    nhat.runAndWait()

speak("Hello , i am the botchat created by Minh Nhat and i will answer all question you can ")

đoạn code này để phát âm thanh bằng giọng nói máy , nó in ra màn hình chuỗi văn bản "Hello, i am the botchat created by Minh Nhat and i will answer all question you can" và sau đó sử dụng đối tượng nhat để phát âm thanh bằng giọng nói máy.


def command():

    c=sr.Recognizer() #object này giúp ta có thể nhận biết giọng nói

    with sr.Microphone() as source:

        c.pause_threshold=2 #Lệnh này để đặt khoảng thời gian dừng giọng nói 

        audio=c.listen(source)

    try:

        query=c.recognize_google(audio,language='en')

        print("Me: "+ query)

    except sr.UnknownValueError:

        print("Please repeat or typing the command ")

        query=str(input('Your order is : '))

    return query

Đoạn code trên dùng để nhận biết giọng nói , ở đây tôi sử dụng tiếng anh 


Sau đó là phần giao tiếp với máy 


if __name__=="__main__":



   welcome()


   while True:


       query=command().lower()


if "open google"in query:



           speak("What should i search boss ? ")


           search=command().lower()


           url=f"https://www.google.com/search?q={search}"


           wb.get().open(url)


           speak(f'Here is your {search} on google')


Ở đây khi bạn nói open google hoặc cái gì đó có dính chữ open google , máy sẽ hiểu là bạn ra lệnh cho nó mở google , tiếp theo nó sẽ hỏi "What should i search boss ? "  để có thể search thông tin bạn cần tìm  

Để giao tiếp bình thường ta chỉ cần nhập từ khóa để khi nói xuất hiện từ khóa đó nó sẽ biết nó sẽ trả lời thế nào 


elif "hi" in query:



           speak("Hi,i can hear you , how can i help you ?")

Để nó có thể mở file trong máy tính bạn cần thêm vào đường dẫn của file đó 


elif "music" in query:



           music=r"C:\Users\Le Minh Nhat\Downloads\[Vietsub+TikTok] Lan Đình Tự - Châu Kiệt Luân -- 蘭亭序 - 周杰倫.mp4"


           os.startfile(music)

Để chụp màn hình bạn sử dụng đoạn code này trên thư viện opencv


elif "take a picture"in query:

          cap = cv2.VideoCapture(0)


           ret, frame = cap.read()


           cv2.imshow("Camera", frame)


           cv2.waitKey(0)


           cap.release()


Đoạn mã trên sẽ khởi tạo một đối tượng VideoCapture của thư viện OpenCV và đọc một khung hình từ camera máy tính. Sau đó, nó hiển thị khung hình đó trên màn hình và đợi cho người dùng nhấn một phím bất kỳ để dừng quá trình hiển thị và đóng lại camera.

 ----- Bạn có thể sáng tạo thêm câu hỏi và trả lời hay các trò chơi mới cho trợ lý ảo của bạn , vì đây là trợ lý ảo cơ bản nên nó chưa có thể tự học được nếu bạn muốn nâng cao kĩ năng này bạn có thể học trên youtube và google -----



Chúc bạn thành công