2012国际数模C题翻译
- 格式:doc
- 大小:29.00 KB
- 文档页数:5
交谈中请勿轻信汇款、中奖信息、陌生电话,勿使用外挂软件。
Gypsophila(312608157) 11:00:17
星际犯罪塑型(ICM)正在调查串谋犯犯罪行为。
调查是非常有信心,他们知道的几名成员的阴谋,但他们进行逮捕之前,希望能找出其他成员和领导人。
阴谋和所有可能涉嫌同谋为同一家公司在一个大办公室复杂的工作。
“公司一直快速增长,并为自己的名称,开发和销售计算机银行和信用卡公司的软件。
ICM最近发现了一个消息从一个小集组82个工人,他们认为在公司将帮助他们找到最有可能的候选人身份不明的同谋者和未知的领导人。
由于信息流量是所有的办公在该公司的工人,它很可能是一些(或许很多)在确定的传播者消息流量不涉及阴谋。
事实上,他们是一定的,他们知道有些人谁是不是在阴谋。
建模工作的目标将是确定人们在办公室复杂谁是最有可能的同谋。
一个优先列表将是理想的,因此ICM可以调查,监视之下的地方,和/或询问最有可能的候选人。
一个判别线分离从非同谋的同谋也将是有益的,以明显的分类,在每个人组。
这也将是有用的模型,如果提名的阴谋领导人检察官办公室。
在当前情况下的数据是给你的犯罪建模团队,你的上司给你以下情形(称为调查的EZ),她曾在几年前在另一座城市。
甚至虽然她是她对简易案件的工作感到非常自豪,她说,这是一个非常小的,简单的例子,但它可以帮助你了解自己的任务。
她的数据如下:她考虑为同谋的十人分别为:安妮#,鲍勃,卡罗尔,大卫*,艾伦,弗雷德,乔治·哈利,伊内兹和JAYE#的。
(*表示前已知的同谋,#表示事先已知nonconspirators)28消息,她为她的案件有编号为每个主题年表的消息,她分配的基础上分析她的消息:安妮鲍勃:你为什么今天迟到了吗?(1)鲍勃卡罗尔:这该死的安妮总是看着我。
我是不是晚了。
(1)卡罗尔戴夫:安妮和鲍勃战斗再次Bob的迟到。
(1)戴夫艾伦:我要看看你今天早晨。
当你能来吗?带来的预算文件。
(2)戴夫弗雷德:我能来,随时随地今天看到你。
让我知道什么时候是一个好时机。
我应该带来的预算文件吗?(2)戴夫乔治:我会看到你以后---说不完的话。
我希望其他人准备的。
重要的是要获得这项权利。
(3)哈里·乔治:你似乎强调。
这是怎么回事?我们的预算将被罚款。
(2)(4)伊内兹乔治:我今天真正的累。
你是如何做?(5)JAYE伊内兹:今天去。
想去的午餐今天吗?(5)伊内兹到JAYE:好东西,它是安静的。
我用尽。
不能做午餐的今天---对不起!(5)乔治·戴维:时间---现在谈!(3)JAYE安妮:你今天去吃午饭吗?(5)戴夫乔治:我不能。
在回家的路上看到弗雷德。
(3)乔治·戴维:获取之后。
(3)安妮卡罗尔:是谁应该看鲍勃?他所有的时间消磨。
(1)卡罗尔·安妮:他独自一人离开。
他正在与乔治和戴夫。
(1)乔治戴夫:这是非常重要的。
织补弗雷德。
埃伦如何?(3)埃伦·乔治:你谈到与戴维?(3)乔治·埃伦:还没有。
是吗?(3)鲍勃·安妮:我是不晚。
只是让你知道---我的工作午餐。
(1)鲍勃·戴夫:告诉他们我是不是太晚了。
你知道我。
(1)埃伦·卡罗尔:获取与安妮,并找出为下周的预算会议日程,并帮助我冷静乔治。
(2)哈利·戴维:你有没有注意到,乔治再次强调了今天?(4)戴夫乔治:织补哈利认为你是强调。
不要让他担心,他将减噪左右。
(4)乔治·哈利:只要工作到很晚,在家的问题。
我将被罚款。
(4)埃伦·哈利:它是确定的,如果我错过了今天的会议?弗雷德将在那里和他所知道的预算更好的比我好。
(2)哈利·弗雷德:我认为明年的财政预算案强调了几个人。
也许我们应该采取的时间保证人民的今天。
(2)(4)弗雷德·哈利:我认为我们的预算是非常健康的。
我没有看到任何强调了过来。
(2)消息流量完你的上司点出局,她分配和编码只有5个不同主题的消息:1)Bob 的迟到,2)的预算,3)重要的未知问题,但认为是阴谋,4)乔治压力,5)午餐和其他社会问题。
正如看到的消息编码,一些消息有两个因为消息的内容分配的主题。
你的上司,她的情况分析表明,通信网络链接和消息类型。
下图是一个消息网络模型,导致网络图上注明的消息类型的代码。
图1:网络的消息,从简易案例您的主管指出,除了已知的同谋乔治和
戴夫,埃伦和卡罗尔你的上司的分析为基础的阴谋被起诉后鲍勃自我承认他参与辩诉交易在减刑,但对卡罗尔的收费后来被丢弃。
你的上司仍然是相当肯定伊内兹参与,但从未对她的情况下成立。
你的上司的意见,您的团队是确定有罪的当事人,使像伊内兹的人不下车,像卡罗尔人诬陷,ICM获得信贷,所以像鲍勃的人没有获得减刑的机会。
目前的情况下:你的上司已经把目前的情况下,网络状的数据库,它具有相同的结构,而且是位范围较大。
研究者有一些迹象表明,一个阴谋正在地方挪用公司的资金和使用网上诈骗,盗窃信用卡资金与该公司业务的人。
她表明你对案件的EZ的小例子,只有10人(节点),27链接(消息),5个主题,1可疑/阴谋主题,2个著名的阴谋家,2已知的非同谋。
到目前为止,新的案件有83个节点,400链接(有些涉及超过1消息流量,15个主题(3超过21000字的主题),已被视为是可疑的),7称为阴谋家,和8个著名的非同谋。
这些数据在所附的电子表格文件:的names.xls,Topics.xls,Messages.xls。
names.xls包含办公室的关键节点数量工人的名字。
topics.xls包含的代码为15的主题号码的简短说明主题。
由于安全和隐私问题,你的团队不会有所有直接成绩单消息流量。
messages.xls提供传输的消息的节点和主题的链接消息中包含的代码号码。
几个消息中包含了三个主题。
为了帮助可视化的信息流量,对人民和消息链接的网络模型图2。
在这种情况下,不显示邮件的主题,因为他们在图1图中。
这些主题数字给予在文件Messages.xls和描述在Topics.xls。
图2:83人(节点)和400之间的这些消息网络模型的可视化人(链接)。
要求:要求1:到目前为止,它被称为琼,杜,保罗,乌尔夫,姚明,哈维和亚历克斯,是同谋。
此外,它被称为达琳,陈德良,贾庆林,Ellin,加尔,克里斯,佩奇,埃斯特没有同谋。
“三个已知的可疑邮件主题是7,11,和13。
有更详细的有关文件中的主题topics.xls。
建立模型和算法的83个节点优先的一部分的可能性阴谋,并解释你的模型和指标。
杰罗姆,德洛利斯,和Gretchen是高级该公司的经理。
这将是非常有益的,要知道,如果其中任何涉及阴谋。
要求2:如何将优先列表的变化,如果新的信息来揭示主题1也连接到阴谋和克里斯是一个阴谋?要求3:一个强大的技术类似的文本信息获取和理解消息流量被称为语义网络分析;作为人工智能的方法计算语言学,它提供了一个结构和有关知识的推理过程或语言。
另一个计算语言学,自然语言处理能力是文本分析。
为我们的罪破坏的情况,解释的内容和上下文语义和文字分析消息流量(如果你能获得的原始消息)可以使你的团队开发甚至更好的模型和办公室人员的分类。
你有没有使用这些功能主题在文件Topics.xls的描述,以提高您的模型吗?要求4:你的完整报告将最终去到DA,所以一定要详细,明确的说明您的假设和方法,但不能超过20页写。
您可能包括你的程序作为单独的文件中的附件,不要指望在你的页面限制,但包括这些计划是没有必要的。
你的上司想要的ICM是世界最好的解决白领,高科技的阴谋罪,并希望您的方法将有助于解决重要世界各地的情况,特别是那些消息流量非常大的数据库(以千数千数万的消息,并可能以百万计的话)的人。
她特别问你包括讨论如何更深入的网络,语义,消息的文本分析内容可以帮助你的模型和建议。
作为报告的一部分给她,解释你为什么和如何可以使用它们来确定,优先技术的网络模型,与分类类似的节点中的任何类型的网络数据库,不只是犯罪阴谋和消息数据。
例如,你的方法找到感染或患病的细胞在生物网络你有各种图像或化学数据表明感染概率的节点已经确定了一些受感染的节点?
破案模型
您的组织,ICM正在调查一个作案阴谋。
调查者非常有信心,因为他们知道阴谋集团的几名成员,但他们希望在进行逮捕之前能找出其他成员和领导人。
主谋者和所有可能涉嫌同谋的人都以复杂的关系为同一家公司在一个大办公室工作。
这家公司一直快速增长,并在开发和销售适用于银行和信用卡公司的计算机软件方面打出了自己的名气。
ICM最近从一个82个工人的小集体那儿得知了一个消息,他们认为这个消息能将帮助他们在公司里找到目前身份尚不明确的同谋者和未知的领导人的最有可能的人选。
由于信息流通涉及到所有的在该公司工作的工人,所以很可能在这次信息流通中有一些(或许很多)已经确定的传播者实际并不涉及阴谋。
事实上,他们确定他们知道一些并不参与阴谋的人。
建模工作的目标是确定在这个复杂的办公室里谁是最有可能的同谋。
一个优先级列表是最理想的,因为ICM可以根据这个来调查,**,和/或询问最有可能的候选人。
一个划分非同谋者与同谋者的分割线也将是有益的,因为可以对每个组里的人进行清楚的分类。
如果能提名阴谋的领导人,那对于检察官办公室也是非常有帮助的。
在把当前情况下的数据给你的犯罪建模团队之前,你的上司给你以下情形(称为调查EZ),那是她几年前在另一座城市工作时的案例。
她对她在简单案件的工作非常自豪,她说,这是一个非常小的,简单的例子,但它可以帮助你了解自己的任务。
她的数据如下:
她认为是同谋的十人分别为Anne#, Bob, Carol, Dave*, Ellen, Fred, George*, Harry, Inez, and Jaye#.(*表示之前已知的同谋,#表示事先已知的非同谋者)
她对她的案件的28个消息记录按照她的分析依据主题进行了编号。
Anne to Bob:你今天为什么迟到了?(1)
Bob to Carol:这该死的Anne总是看着我。
我并没有迟到。
(1)
Carol to Dave:Anne 和Bob又再为Bob的迟到吵架了。
(1)
Dave to Ellen:我今天早上要见你。
你什么时候能来?把预算文件顺便带过来。
(2)Dave to Fred:我今天随时随地都可以去见你。
让我知道什么时候比较好。
我需要带预算文件吗?(2)
Dave to George:我待会见你---有很多需要谈的。
我希望其他人都准备好。
获得这项权利?很重要。
(3)
Harry to George:你似乎很紧张。
怎么回事?不用担心,我们的预算会好的。
(2)(4)Inez to George:我今天真的很累。
你呢,还好吗?(5)
Jaye to Inez:也不怎么样今天(?)。
今天一起去吃午饭怎么样?(5)
Inez to Jaye:幸好一切都很平静。
我已经精疲力竭,不能做午饭了今天。
抱歉!(5)George to Dave:现在来见我!(3)
Jaye to Anne:你去吃午饭吗今天?(5)
Dave to George:我没法去,现在正要去见Fred。
(3)
George to Dave:见完他后到我这来。
(3)
Anne to Carol:谁来监督一下Bob?他整天游手好闲的。
(1)
Carol to Anne:别管他。
他和George and Dave合作得很好。
(1)
George to Dave:这个很重要。
该死的Fred。
Ellen怎么样了?(3)
Ellen to George:你和Dave谈过了吗?(3)
George to Ellen:还没。
你呢?(3)
Bob to Anne:我没有迟到。
而且你知道我午饭时间都在工作呢。
(1)
Bob to Dave:告诉他们我没有迟到。
你了解我的。
(1)
Ellen to Carol:联系Anne安排下个星期的预算会议日程,还有,帮我让George冷静点。
(2)Harry to Dave:你有没有注意到George今天看上去又很紧张/有压力?(4)
Dave to George:该死的Harry觉得你很紧张。
别让他担心,免得他四处打探。
(4)George to Harry:我只是工作得太晚,家里又有点问题。
不用担心,我很好。
(4)
Ellen to Harry:我忘了今天的会议了,怎么办?Fred会在那的,而且他比我更了解预算。
(2)Harry to Fred:我觉得明年的预算会让一些人很有压力的。
或许你今天该花点时间让大家安心。
(2)(4)
Fred to Harry:我觉得我们的预算很正常,我没觉得会有人感到有压力。
(2)
通信记录结束。
你的上司指出,她只分配和编号了5个不同的消息主题:
1)Bob的迟到,
2)预算,
3)重要的未知的问题,可能是阴谋,
4)乔治的压力,
5)午餐和其他社会问题。
正如看到的消息编码那样,一些消息根据内容有两个主题。
你的上司按照通信联系和消息类型构造的通信网络分析案件。
下图是一个消息网络模型,网络图上注明了消息类型的代码。
您的上司说,除了已知的同谋George and Dave之外,根据她的分析Ellen and Carol也被认为是同谋。
而且不久后,Bob招认出他确实参与其中,从而希望得到减刑。
而对Carol的控告后来被放弃了。
你的上司至今仍然相当肯定Inez也参与了,但却从未对她立案。
你的上司建议您的团队,确定有罪的当事人,使像Inez的人不漏网,像Carol的人不被诬陷,从而增加ICM的信用,使像Bob的人不再有获得减刑的机会。
现在的案件:
你的上司已经把目前的情况下构造成网络状的数据库,它具有和上面相同的结构,只是范围较大。
调查者有一些线索表明,一个阴谋正在挪用公司的资金和使用网上诈骗盗窃在该公司做业务的顾客的信用卡资金。
她给你看的简单案件的小例子,只有10个人(节点),27条边(消息),5个主题,1个可疑/阴谋主题,2个确定的罪犯,2个已知的清白者。
而到目前为止,这个新的案件却已经有83个节点,400条边(有些不止涉及1个主题),超过21000个单词的消息记录,15个主题(其中3个已被视为是可疑的),7个已知的罪犯,和8个已知的清白者。
这些数据在所附的电子表格文件:names.xls,Topics.xls,Messages.xls中给出。
names.xls包含办公室的关键节点对应的员工的名字。
topics.xls包含15个主题的代号及简短说明。
由于安全和隐私问题,你的团队不会有所有的直接消息记录。
messages.xls提供传输消息的节点对,和该消息的主题(可能不止一个主题,最多3个主题)。
为了使信息的沟通更加直观可视,图2提供了员工和消息链接的网络模型。
在这种情况下,不再像图1那样显示消息的主题。
而是在文件Messages.xls里给出主题的数目,并在Topics.xls中给以描述。
要求:
要求1:到目前为止,已知Jean, Alex, Elsie, Paul, Ulf, Yao, and Harvey是罪犯,Darlene, Tran, Jia, Ellin, Gard, Chris, Paige, and Este不是罪犯。
可以的消息主题是7,11和13。
关于主题更多的信息在Topics.xls里。
建立模型和算法,把83个节点按照他是阴谋者的可能性大小排序,并解释你的模型和指标。
Jerome, Delores, and Gretchen是该公司的高级经理。
如果他们三个人中任何一个涉及阴谋
这将是非常有益的。
要求2:优先列表将有神秘变化,如果有新的信息告知我们说主题1也与阴谋有关,而且克里斯是一个阴谋?(即多了两个线索)
要求3:一个强大的与这个消息流通网络类似的获取和理解文本信息的技术被称为语义网络分析(semantic network analysis);作为人工智能和计算语言学的方法,它提供了一个结构,并可进行有关知识或语言的推理过程。
另一个有关自然语言处理的计算语言学是文本分析text analysis。
针对我们的破案的情况,解释:如果你能获得原始消息,那么对信息流量的上下文和内容进行语义和文字分析对于帮助你们的团队开发出更好的模型和办公室人员的分类有多大的帮助和加强作用?
你有没有使用这些基于文件Topics.xls中的主题描述的功能来提高您的模型?
要求4:你的完整报告将最终提交给检察官办公室,所以一定要详细、明确地说明您的假设和方法,但不能超过20页。
您可以包括你的程序作为单独的文件中的附件使你的论文不超过页面限制,但包括这些程序不是必须的。
你的上司希望ICM是世界最好的解决白领、高科技的阴谋罪的机构,并希望您的方法有助于解决重要的世界各地的案件,特别是那些消息流量非常大的数据库(可能有数万的信息和数百万的单词)。
她特别要求你在论文中讨论:更深入的网络,语义,消息的文本分析内容是如何帮助你的模型和建议的。
作为给她的报告的一部分,请解释你用到的网络模型技术,以及为什么使用和它们可以怎么被用于任何类型的网络数据库从而来确定,优先级排序,和对相似结点分类的技术的网络模型,而不仅仅是犯罪阴谋和消息数据。
比如,给你各种图像或化学数据,其中表明了感染概率和已经确定了的一些受感染的结点,你的方法能用来在生物网络中找到感染或患病的细胞吗?。