Crime Scene Report 犯罪现场报告 Python字符串处理

Crime Scene Report 犯罪现场报告

Victim and Suspect were hiking along a remote trail in the Mojave Desert. By the time Victim and Suspect were able to hike back to the trailhead and receive medical attention, Victim was in critical condition. Suspect reports that it took approximately 10 hours to hike back to the trail head due to rough terrain and Victim’s weakened condition. Suspect also reports trying to suck the venom out of Victim’s leg. (NOTE: this is not effective or safe. In case of a snake bite, seek medical attention and do not try to suck out venom). Victim died en route to the hospital.
受害者和嫌疑犯沿着一条僻静的小径在莫哈韦沙漠远足。当受害者和嫌疑犯走回小路的起点并获得医护人员的协助时,受害者已经处在严重的情况。嫌疑犯报告他们大概要花10个小时走回起点,因为崎岖的地形和受害者虚弱的身体情况。嫌疑犯同时报告他试着把毒液从受害者腿上吸出来。(注意:这并没有效果而且不安全。如果被蛇咬了,要寻求医护人员的帮助而且不要吸毒液)。受害者在去往医院的途中去世了。
However, we have reason to believe there may have been foul play. Suspect had a suspicious search history, including repeated searches of the effects of King Cobra venom on humans and suspicious communications with a local reptile store. Investigators worry that Suspect may have tried to inject King Cobra venom into a fake snake bite wound site.
然而,我们有理由相信这可能是谋杀。嫌疑犯有可疑的检索历史记录,包括重复搜索眼镜王蛇的毒液在人身上的效果和与当地一家爬虫商店可疑的聊天记录。调查者担心嫌疑犯有可能将眼镜王蛇的毒液注射到伪造的蛇咬伤口。
Forensic scientists called to the scene swabbed Victim’s bite wound and sent samples off for DNA sequencing.
法医在现场擦拭了受害者的咬伤伤口并将样本送去DNA测序。
The toxicologist have identified 4 proteins that may be of interest:
毒理学家已经确认了4种可能会引起注意的蛋白质。
1.AMYS_HUMAN
2.HRTD_CROAT
3.ALBU_HUMAN
4.VESP_OPHHA

DNARNAProtein: Biology Refresher Information
This information is also covered in the video attached to this lab assignment!

Translating DNA Sequences to proteins: A set of three nucleotides is called a “codon”. Each codon corresponds to an amino acid or STOP. STOP is a signal to stop translation. A protein is made of a string of amino acids.
将DNA序列转化为蛋白质:一组3个核苷酸被称为1个密码子。每个密码子对应1个氨基酸或STOP。STOP是停止转化的信号。一个蛋白质是由一串氨基酸组成的。
在这里插入图片描述

Open Reading Frames: A single DNA sequence can contain the information to encode many different amino acid sequences.
开放阅读框:单个DNA序列包含了信息去编码许多不同的氨基酸链。
When searching for potential proteins encoded by a DNA sequence, we look for sequences sandwiched between START and STOP codons (with no other stop codons in between!). These sequences are called Open Reading Frames (ORFs). In the diagram below, STOP codons are indicated by .
当搜寻由DNA序列编码成的潜在的蛋白质时,我们寻找加在开始和停止密码子中间的序列(没有其他停止密码子在中间)。这些序列被称为开放阅读框(ORFs)。下面的图表中,停止密码子用
表示。
在这里插入图片描述

(image from: https://www.mun.ca/biology/scarr/Reading_Frames_in_mtDNA.html)

Assumptions in this lab: For the purpose of this lab, we are ignoring some really interesting layers of complexity. We are making the over-simplified assumption that DNA gets translated directly into functional proteins. But, this ignores some really cool processes including post-transcriptional mRNA splicing/capping/polyadenylation and post-translational protein modifications. (这一句都是生物术语不会翻,不影响做题)Here’s a fun Crash Course video, if you’re interested in exploring the biology of this further: https://www.youtube.com/watch?v=itsb2SqR-R0.
本实验的假设:为了本实验的目的,我们忽略了一些很有趣的复杂层面。我们做过于简化的假设:DNA直接转化成有功能的蛋白质。

Given Information
Modules you’re allowed (but not required) to import: os, numpy, my given codon table in codon.py. If you want to import any other module, please pre-approve it with me first. Thank you!

.txt files: will receive two .txt files, each in FASTA format. FASTA format is a text file where a description of the sequence is written on one line in the format: “>Description” and the sequence itself is written on the following lines. The start of a new sequence is indicated by a new “>Description” line.

The first .txt file contains the DNA sequences from the “Lab Results”.

The second .txt file contains amino acid sequences for “Proteins of Interest”.

.py files:
You will receive a codon.py file containing a dictionary whose keys are codons and values are the associated amino acid.

You will receive a lastname_lab3.py file containing starter code for this lab. The starter code contains some helpful hints and provides a general structure for your work.

You will receive a webb_lab3_test.py file containing test cases for your read_FASTA, dna2protein, and findORFs functions. You will also receive a webbtest.py module that is needed to run the webb_lab3_test.py test cases.

Your Task

1.Use the website www.uniprot.org to fill out the chart below. Your answers should be about 2 sentences per protein.

Protein Relevance to the case

AMYS_HUMAN The enzyme initiates starch digestion in the oral cavity of human, so human’s saliva contains this enzyme. If the suspect tried to suck venom out of victim’s leg, this enzyme should be detected at the snake bite. 这种酶在人类的口腔中开始淀粉的消化,所以人类的唾液中含有这种酶。如果嫌疑犯试过从受害者腿上吸出毒液,这种酶应该会在蛇咬伤口中被发现。
HRTD_CROAT This venom is from Western diamondback rattlesnake rather than from King Cobra. If this is detected at the snake bite, then the snake bite should be real as the victim was truly bitten by Western diamondback rattlesnake. 这种毒液来自西部菱形斑纹响尾蛇而不是眼镜王蛇。如果它在蛇咬伤口被发现,蛇咬伤口应该是真的,因为受害者是被响尾蛇咬的。
ALBU_HUMAN It is a protein that can be found in human blood. Detection of this protein might prove that the victim bled from the bite, while both snake bite and venom injection would cause victim to bleed.它是一种可以在人类血液中被发现的蛋白质。发现这种蛋白质可能证明受害者是因为咬伤出血,然而蛇咬伤和毒液注射都会引起受害者出血。
VESP_OPHHA This toxin is from the king cobra rather than from Western diamondback rattlesnake. So, if this is de

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/422003.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

用HTML5的<canvas>元素实现刮刮乐游戏

用HTML5的&#xff1c;canvas&#xff1e;元素实现刮刮乐游戏 用HTML5的<canvas>元素实现刮刮乐&#xff0c;要求&#xff1a;将上面的“图层”的图像可用鼠标刮去&#xff0c;露出下面的“图层”的图像。 示例从简单到复杂。 简单示例 准备两张图像&#xff0c;我这…

鸿蒙学习day1基础语法 基础变量类型

在这里插入图片描述 什么是变量&#xff1a;变量就是一些数据 如125&#xff0c;‘字符串数据’ 通过一个符号来表示 变量的定义 方法 let 变量名&#xff1a;变量类型 ’ 各种数据’ ,let是关键字&#xff0c;系统给的用来定义变量的 let name: string 张亚洲; let age: …

《求生之路2》服务器如何选择合适的内存和CPU核心数,以避免丢包和延迟高?

根据求生之路2服务器的实际案例分析选择合适的内存和CPU核心数以避免丢包和延迟高的问题&#xff0c;首先需要考虑游戏的类型和对服务器配置的具体要求。《求生之路2》作为一款多人在线射击游戏&#xff0c;其服务器和网络优化对于玩家体验至关重要。 首先&#xff0c;考虑到游…

Flutter中Widget的生命周期

Widget生命周期&#xff1a; createState-initState-didChangeDependency-build-deactive-dispose 可通过WidgetsBinding类对widget生命周期的回调进行监控。 createState&#xff1a;StatefulWidget 中用于创建 State&#xff1b; initState&#xff1a;State 的初始化操作&am…

Ubuntu22.04下在Spark2.4.0中采用Local模式配置并启动pyspark

目录 一、前言 二、版本信息 三、配置相关文件 1.修改spark-env.sh文件 2.修改.bashrc文件 四、安装Python3.5.2并更改默认Python版本 1.查看当前默认Python版本 2.安装Python3.5.2 2.1 下载Python源码 2.2 解压源码 2.3 配置安装路径 2.4 编译和安装 2.5 验证安装…

【计算机网络_应用层】协议定制序列化反序列化

文章目录 1. TCP协议的通信流程2. 应用层协议定制3. 通过“网络计算器”的实现来实现应用层协议定制和序列化3.1 protocol3.2 序列化和反序列化3.2.1 手写序列化和反序列化3.2.2 使用Json库 3.3 数据包读取3.4 服务端设计3.5 最后的源代码和运行结果 1. TCP协议的通信流程 在之…

c++/c图的邻近矩阵表示

#include<iostream> using namespace std;#define MaxVerterNum 100 typedef char VerterType; typedef int EdgeType; typedef struct {VerterType vexs[MaxVerterNum]; // 存储顶点EdgeType edges[MaxVerterNum][MaxVerterNum]; // 存储邻接矩阵int n, e; // 顶点数和边…

基于粒子群优化算法的图象聚类识别matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述 基于粒子群优化算法的图象聚类识别。通过PSO优化方法&#xff0c;将数字图片的特征进行聚类&#xff0c;从而识别出数字0~9. 2.测试软件版本以及运行结果展示 M…

【NTN 卫星通信】使用地面网络和卫星网络接入的终端应用场景

1 场景概述 卫星接入有广覆盖的特点&#xff0c; 可以改善地面接入网覆盖或无线条件差的地区(例如多径干扰)的服务可用性。对于高速移动中需要实时业务的终端&#xff0c;如IMS语音/视频会议&#xff0c;可以通过地面接入和卫星接入同时实现与5G系统的双连接&#xff0c;在地面…

HTML教程(3)——常用标签(1)

一、图片标签 1.场景&#xff1a;在网页中显示图片 2.基本写法&#xff1a; <img src""> 3.特点&#xff1a;单标签&#xff0c;img标签需要展示对应的效果&#xff0c;需要借助其属性进行设置 4常用属性&#xff1a; src&#xff1a;其属性值为目标图片…

爬取博客的图片并且将它存储到响应的目录

目录 前言 思想 注意 不多说解释了&#xff0c;贴代码吧 config.json Get_blog_img.py 把之前的写的代码也贴上 Get_blog_id.py 主函数 main.py 运行结果 前言 在上一篇博客中我们介绍了如何爬取博客链接 利用python爬取本站的所有博客链接-CSDN博客文章浏览阅读74…

Docker使用数据卷自定义镜像Dockerfile

文章目录 一、数据卷二、Dockerfile自定义centos 一、数据卷 数据卷(Data Volumes)是一个可供一个或多个容器使用的特殊目录&#xff0c;它将主机操作系统目录直接映射进容器&#xff0c;它可以提供很多有用的特性&#xff1a; 1.数据卷 可以在容器之间共享和重用 2.对数据卷的…

React富文本编辑器开发(二)

我们接着上一节的示例内容&#xff0c;现在有如下需求&#xff0c;我们希望当我们按下某个按键时编辑器有所反应。这就需要我们对编辑器添加事件功能onKeyDown, 我们给 Editor添加事件&#xff1a; SDocor.jsx import { useState } from react; import { createEditor } from…

蓝桥杯练习系统(算法训练)ALGO-993 RP大冒险

资源限制 内存限制&#xff1a;64.0MB C/C时间限制&#xff1a;200ms Java时间限制&#xff1a;600ms Python时间限制&#xff1a;1.0s 问题描述 请尽情使用各种各样的函数来测试你的RP吧~~~ 输入格式 一个数N表示测点编号。 输出格式 一个0~9的数。 样例输入 0 样…

小乌龟操作Git

1、选择小乌龟作为git客户端 最近使用idea来操作git的时候频频出现问题&#xff0c;要么是提交代码的时候少了某些文件&#xff0c;导致克隆下来无法运行&#xff0c;要么是提交速度太慢。 反正是在idea中操作git体验非常不好&#xff0c;所以决定来换一种方式来操作git。从网…

利用FFMPEG 将RTSP流的音频G711 转码为AAC 并 推流到RTMP

之前我们的视频转码项目中 是没有加入音频的 现在 需要加入音频 &#xff0c;由于RTMP只支持AAC的 音频流 而有的RTSP流的音频编码并不是AAC 大多数都是G711编码 还分为G711A 和G711U 之前用ffmpeg命令行可以直接 完成转码 并推送到RTMP 但是考虑到无法获取更详细的状…

4.Java---方法+重载

方法 方法的调用是需要开辟内存的,方法调用结束内存就被销毁了. 下面将介绍一个经典的错误标准的0分的示意! 我们日常中写交换两个数字的代码的时候都会用如下的方法进行描述: 你是不是觉得自己写的特别对!终于可以独立写一个小小的函数了? 下面运行一下看看结果 哦莫!怎么…

解决ODOO12 恢复数据库提示内存不够报错

1. 现象 点击 ‘restore database’ 控制台报错&#xff1a; 2. 解决措施 a. 进入启动脚本的文件夹 cd odoo/odoo-12.0/输入命令 ./odoo-bin --addons-pathaddons --databaseodoo --db_userodoo --db_passwordodoo --db_hostlocalhost --db_port5432 -i INITb. 刷新页面…

【airtest】自动化入门教程(三)Poco操作

目录 一、准备工作 1、创建一个pthon脚本 2、光标位置 2、选择Android 3、选择yes 二、定位元素 三、poco基于设备/屏幕 方式 1、poco.click( (x,y))基于屏幕点击相对坐标为x&#xff0c;y的位置 2、poco.get_screen_size() 3、poco.swipe(v1,v2)基于屏幕从v1位置滑到…

图论 - 最短路(Dijkstra、Bellman-Ford、SPFA、Floyd)

文章目录 前言Part 1&#xff1a;朴素Dijkstra算法一、Dijkstra求最短路 I1.问题描述输入格式输出格式数据范围输入样例&#xff1a;输出样例&#xff1a; 2.算法 Part 2&#xff1a;堆优化Dijkstra算法一、Dijkstra求最短路 II1.题目描述输入格式输出格式数据范围输入样例&…