百度语言翻译机-低调大师

百度语言翻译机

2017-11-07 617

百度语言翻译机

时限 1s

百度的工程师们是非常注重效率的，在长期的开发与测试过程中，他们逐渐创造了一套他们独特的缩率语。他们在平时的交谈，会议，甚至在各中技术文档中都会大量运用。

为了让新员工可以更快地适应百度的文化，更好地阅读公司的技术文档，人力资源部决定开发一套专用的翻译系统，把相关文档中的缩率语和专有名词翻译成日常语言。

输入数据：

输入数据包含三部分

1. 第一行包含一个整数 N （ N<=10000 ），表示总共有多少个缩率语的词条。

2. 紧接着有 N 行的输入，每行包含两个字符串，以空格隔开。第一个字符串为缩率语（仅包含大写英文字符，长度不超过 10 ），第二个字符串为日常语言（不包含空格，长度不超过 255 ） .

3. 从第 N+2 开始到输入结束为包含缩略语的相关文档。（总长度不超过 1000000 个字符）

输出数据：

输出将缩率语转换成日常语言的文档。（将缩率语转换成日常语言，其他字符保留原样）

输入样例

6

PS 门户搜索部

NLP 自然语言处理

PM 产品市场部

HR 人力资源部

PMD 产品推广部

MD 市场发展部

百度的部门包括 PS ， PM ， HR ， PMD ， MD 等等，其中 PS 还包括 NLP 小组。

输出样例

百度的部门包括门户搜索部，产品市场部，人力资源部，产品推广部，市场发展部等等，其中门户搜索部还包括自然语言处理小组。

注意：

1 ．输入数据中是中英文混合的，中文采用 GBK 编码。

2 ．为保证答案的唯一性，缩率语的转换采用正向最大匹配（从左到右为正方向）的原则。请注意输入例子中 PMD 的翻译。

#include<iostream>
#include<string>

using namespace std;

int main()
{
    int n;
    cout<<"input a number:";
    cin>>n;
    while((n>1000)||n<1)
    {
        cout<<"please input a real number:";
        cin>>n;
    }

    string s_name[1000],f_name[1000];
    for(int i=0;i<n;i++)
    {
        cin>>s_name[i]>>f_name[i];
    }

    //防止比较过程中断的先被找到，要对缩略语进行从长到段的排序 冒泡排序
    for(int i=0;i<n-1;i++)
        for(int j=i+1;j<n;j++)
        {
            if(s_name[i].length()<s_name[j].length())
            {
                swap(s_name[i],s_name[j]);
                swap(f_name[i],f_name[j]);
            }
        }

    
    string s;
    cout<<"\n please input the content："<<endl;
    cin>>s;

    for(int i=0;i<n;i++)
    {
        while(s.find(s_name[i])!=string::npos)
        {
            int index=s.find(s_name[i]);
            s.erase(index,s_name[i].length());//删除简写的名称
            s.insert(index,f_name[i]);//插入全称
        }
    }

    cout<<"the full content is:"<<endl;
    cout<<s<<endl;

    return 0;
}

不使用string类的方法用结构体实现

#include<iostream>
using namespace std;

struct Baidu
{
    char s_name[10];
    char f_name[100];
};

void sort_name(Baidu baidu[],int n)
{
    for(int i=0;i<n-1;i++)
        for(int j=i;j<n;j++)
        {
            if(strlen(baidu[i].s_name)<strlen(baidu[j].s_name))
                swap(baidu[i],baidu[j]);
        }
}

void replace_name(Baidu baidu[],char s[],int n)
{
    int length;
    char tmp[1000];
    for(int i=0;i<n;i++)
    {
        char *p=strstr(s,baidu[i].s_name);
        while(p!=NULL)
        {
            length=strlen(baidu[i].s_name);
            *p=0;
            strcpy(tmp,p+length);//把简称后面的内容全部拷贝到tmp内
            //strcat(s,baidu[i].f_name);
            strcat(p,baidu[i].f_name);
            //strcat(s,tmp);
            strcat(p+strlen(baidu[i].f_name),tmp);
            p=strstr(s,baidu[i].s_name);
        }
    }
}

int main()
{
    int n;
    cout<<"input the number of s-f word:";
    cin>>n;
    Baidu baidu[10];
    for(int i=0;i<n;i++)
        cin>>baidu[i].s_name>>baidu[i].f_name;
    sort_name(baidu,n);
    cout<<"input the content:"<<endl;
    char s[1000];
    cin>>s;
    replace_name(baidu,s,n);
    cout<<"replaced content is:"<<endl;
    cout<<s;
}

本文转自cococo点点博客园博客，原文链接：http://www.cnblogs.com/coder2012/archive/2012/10/02/2710518.html，如需转载请自行联系原作者

微信关注我们

原文链接：https://yq.aliyun.com/articles/384025

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

卷积神经网络——本质上是在利用卷积做特征压缩，然后再全连接

原文：https://www.zybuluo.com/hanbingtao/note/485480 写得非常好，可以细读全连接网络 VS 卷积网络全连接神经网络之所以不太适合图像识别任务，主要有以下几个方面的问题：参数数量太多考虑一个输入1000*1000像素的图片(一百万像素，现在已经不能算大图了)，输入层有1000*1000=100万节点。假设第一个隐藏层有100个节点(这个数量并不多)，那么仅这一层就有(1000*1000+1)*100=1亿参数，这实在是太多了！我们看到图像只扩大一点，参数数量就会多很多，因此它的扩展性很差。没有利用像素之间的位置信息对于图像识别任务来说，每个像素和其周围像素的联系是比较紧密的，和离得很远的像素的联系可能就很小了。如果一个神经元和上一层所有神经元相连，那么就相当于对于一个像素来说，把图像的所有像素都等同看待，这不符合前面的假设。当我们完成每个连接权重的学习之后，最终可能会发现，有大量的权重，它们的值都是很小的(也就是这些连接其实无关紧要)。努力学习大量并不重要的权重，这样的学习必将是非常低效的。网络层数限制我们知道网络层数越多其表达能力...

2017-11-08

734

Kinect for windows提供了语音识别的能力，它靠Kinect的语音采集流进行识别的，这是建立在微软的语音识虽库的基础上的，关于微软语音识别可以参考http://msdn.microsoft.com/en-us/library/hh361572(v=office.14).aspx。对别Kinect识别的语音，目前只支持如下语言：en-US,de-DE,en-AU,en-CA,en-GB,en-IE,en-NZ,es-ES,es-MX,fr-CA,fr-FR,it-IT,ja-JP（很遗憾没有中文，相信在不远的将来会有的）。下列代码为语音识别： KinectSensorkinectsensor=null; SpeechRecognitionEnginespeechEngine; privatevoidForm1_Shown(objectsender,EventArgse) { //从Kinect集合中找到连接上的Kinect foreach(KinectSensorksinKinectSensor.KinectSensors) { //找到连接的Kinect ...

2017-11-08

586

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。