0025: 语音打开浏览器搜索引擎

xieyajie · xieyajie · commit 98bc77db9ca0 · 2016-04-15T15:35:50.000+08:00
diff --git a/xyjxyf/0025/voice_open_browser.py b/xyjxyf/0025/voice_open_browser.py
@@ -0,0 +1,78 @@
+# encoding = utf-8
+
+# use pyAudio
+# brew install portaudio
+# pip install pyaudio
+
+import wave, pyaudio
+from datetime import datetime
+from tools import dxbaiduaudio
+import webbrowser
+
+CHUNK = 1024
+FORMAT = pyaudio.paInt16
+RATE = 8000
+CHANNELS = 1
+RECORD_SECONDS = 5
+
+def record_wave(to_dir=None):
+    if to_dir is None:
+        to_dir = "./"
+
+    pa = pyaudio.PyAudio()
+    stream = pa.open(format = FORMAT,
+                     channels = CHANNELS,
+                     rate = RATE,
+                     input = True,
+                     frames_per_buffer = CHUNK)
+
+    print("* recording")
+
+    save_buffer = []
+    for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
+        audio_data = stream.read(CHUNK)
+        save_buffer.append(audio_data)
+
+    print("* done recording")
+
+    # stop
+    stream.stop_stream()
+    stream.close()
+    pa.terminate()
+
+    # wav path
+    file_name = datetime.now().strftime("%Y-%m-%d_%H_%M_%S")+".wav"
+    if to_dir.endswith('/'):
+        file_path = to_dir + file_name
+    else:
+        file_path = to_dir + "/" + file_name
+
+    # save file
+    wf = wave.open(file_path, 'wb')
+    wf.setnchannels(CHANNELS)
+    wf.setsampwidth(pa.get_sample_size(FORMAT))
+    wf.setframerate(RATE)
+    # join 前的类型
+    wf.writeframes(b''.join(save_buffer))
+    wf.close()
+
+    return file_path
+
+def browser_open_text(text):
+    if text is None:
+        return
+
+    url = "http://www.baidu.com"
+    if text.startswith("谷歌") or text.startswith("google"):
+        url = "http://www.google.com"
+    elif text.startswith("必应") or text.startswith("bing"):
+        url = "http://cn.bing.com"
+
+    webbrowser.open_new_tab(url)
+
+if __name__ == "__main__":
+    to_dir = "./"
+    file_path = record_wave(to_dir)
+
+    text = dxbaiduaudio.wav_to_text(file_path)
+    browser_open_text(text)
diff --git a/xyjxyf/show_me_the_code.py b/xyjxyf/show_me_the_code.py
@@ -516,7 +516,7 @@ def encrypt_password(password, salt=None):
 
 
 # 第 0025 题： 使用 Python 实现：对着电脑吼一声,自动打开浏览器中的默认网站
-
+# 在文件夹0025中实现
 
 
 if __name__ == "__main__":
diff --git a/xyjxyf/tools/dxbaiduaudio.py b/xyjxyf/tools/dxbaiduaudio.py
@@ -0,0 +1,115 @@
+# encoing = utf-8
+
+from urllib import request
+import json, base64, uuid, os
+import wave
+import pycurl
+import io
+
+bda_app_id = "7972313"
+bda_api_key = "ZrjLfF5Rh7pOL66gaOmDGnXn"
+bda_secret_key = "16bac9645093ca2632ebb81015ff7544"
+
+bda_access_token = ""
+bda_expires_in = ""
+ret_text = ""
+
+def get_mac_address():
+    return uuid.UUID(int=uuid.getnode()).hex[-12:]
+
+def get_access_token():
+    url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=ZrjLfF5Rh7pOL66gaOmDGnXn&client_secret=16bac9645093ca2632ebb81015ff7544"
+
+    req = request.Request(url, method="POST")
+    resp = request.urlopen(req)
+    data = resp.read().decode('utf-8')
+    json_data = json.loads(data)
+
+    global bda_access_token
+    bda_access_token = json_data['access_token']
+
+    return bda_access_token
+
+CHUNK = 1024
+def get_wav_data(wav_path):
+    if wav_path is None or len(wav_path) == 0:
+        return None
+
+    fp = wave.open(wav_path, 'rb')
+    nf = fp.getnframes()
+    f_len = nf * 2
+    audio_data = fp.readframes(nf)
+
+    return audio_data, f_len
+
+def dump_res(buf):
+    resp_json = json.loads(buf.decode('utf-8'))
+    ret = resp_json['result']
+
+    global ret_text
+    ret_text = ret[0]
+
+    print(buf)
+
+def wav_to_text(wav_path):
+    if wav_path is None or len(wav_path) == 0:
+        return None
+
+    if len(bda_access_token) == 0:
+        get_access_token()
+        if len(bda_access_token) == 0:
+            return None
+
+    data, f_len = get_wav_data(wav_path)
+
+    url = 'http://vop.baidu.com/server_api?cuid=' + get_mac_address() + '&token=' + bda_access_token
+    http_header = [
+        'Content-Type: audio/pcm; rate=8000',
+        'Content-Length: %d' % f_len
+    ]
+
+    c = pycurl.Curl()
+    c.setopt(pycurl.URL, str(url)) #curl doesn't support unicode
+    #c.setopt(c.RETURNTRANSFER, 1)
+    c.setopt(c.HTTPHEADER, http_header)   #must be list, not dict
+    c.setopt(c.POST, 1)
+    c.setopt(c.CONNECTTIMEOUT, 30)
+    c.setopt(c.TIMEOUT, 30)
+    c.setopt(c.WRITEFUNCTION, dump_res)
+    c.setopt(c.POSTFIELDS, data)
+    c.setopt(c.POSTFIELDSIZE, f_len)
+    c.perform() #pycurl.perform() has no return val
+
+    return ret_text
+
+
+# def wav_to_text(wav_path):
+#     if wav_path is None or len(wav_path) == 0:
+#         return None
+#
+#     wav_data = get_wav_data(wav_path)
+#     if wav_data is None:
+#         return None
+#
+#     if len(bda_access_token) == 0:
+#         get_access_token()
+#
+#     wav_base64 = base64.b64decode(wav_data)
+#     print("%s", wav_base64)
+#     # unicode( wav_base64, errors='ignore')
+#     wav_len = len(wav_data)
+#     data_dic = {'format':'wav', 'rate':8000, 'channel':1,
+#                 'cuid':get_mac_address(), 'token':bda_access_token,
+#                 b'speech':wav_base64, 'len':wav_len}
+#     json_data = json.dumps(data_dic).encode('utf-8')
+#     json_len = len(json_data)
+#
+#     req = request.Request('http://vop.baidu.com/server_api')
+#     req.add_header('Content-Type', "application/json")
+#     req.add_header("Content-Length", json_len)
+#     resp = request.urlopen(req, data=json_data)
+#
+#     resp_data = resp.read().decode('utf-8')
+#     resp_json = json.loads(resp_data)
+#
+#     return resp_json['result']