FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2760, 251 aa 1>>>pF1KE2760 251 - 251 aa - 251 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9486+/-0.000616; mu= 17.5220+/- 0.037 mean_var=67.1334+/-13.452, 0's: 0 Z-trim(111.6): 19 B-trim: 0 in 0/51 Lambda= 0.156533 statistics sampled from 12662 (12680) to 12662 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.744), E-opt: 0.2 (0.379), width: 16 Scan time: 1.010 The best scores are: opt bits E(33420) CCDS58807.1 APOBEC3B gene_id:9582|Hs109|chr22 ( 357) 1378 319.3 2.2e-87 CCDS13982.1 APOBEC3B gene_id:9582|Hs109|chr22 ( 382) 1378 319.4 2.3e-87 CCDS33648.1 APOBEC3F gene_id:200316|Hs109|chr22 ( 373) 1127 262.7 2.6e-70 CCDS46709.1 APOBEC3D gene_id:140564|Hs109|chr22 ( 386) 760 179.8 2.4e-45 CCDS13983.1 APOBEC3C gene_id:27350|Hs109|chr22 ( 190) 710 168.3 3.5e-42 CCDS13984.1 APOBEC3G gene_id:60489|Hs109|chr22 ( 384) 654 155.9 3.9e-38 CCDS87027.1 APOBEC3D gene_id:140564|Hs109|chr22 ( 202) 530 127.7 6.3e-30 CCDS41747.1 AICDA gene_id:57379|Hs109|chr12 ( 198) 413 101.2 5.6e-22 CCDS13981.1 APOBEC3A gene_id:200315|Hs109|chr22 ( 199) 379 93.6 1.1e-19 CCDS54531.1 APOBEC3H gene_id:164668|Hs109|chr22 ( 182) 336 83.8 9e-17 CCDS13985.1 APOBEC3H gene_id:164668|Hs109|chr22 ( 183) 336 83.8 9e-17 CCDS54530.1 APOBEC3H gene_id:164668|Hs109|chr22 ( 200) 336 83.8 9.6e-17 CCDS4848.1 APOBEC2 gene_id:10930|Hs109|chr6 ( 224) 335 83.7 1.2e-16 CCDS81662.1 AICDA gene_id:57379|Hs109|chr12 ( 188) 313 78.6 3.4e-15 CCDS8579.1 APOBEC1 gene_id:339|Hs109|chr12 ( 236) 310 78.0 6.4e-15 CCDS54532.1 APOBEC3H gene_id:164668|Hs109|chr22 ( 154) 249 64.1 6.5e-11 >>CCDS58807.1 APOBEC3B gene_id:9582|Hs109|chr22 (357 aa) initn: 1378 init1: 1378 opt: 1378 Z-score: 1682.5 bits: 319.3 E(33420): 2.2e-87 Smith-Waterman score: 1378; 95.5% identity (97.0% similar) in 199 aa overlap (1-199:1-199) 10 20 30 40 50 60 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 FEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISA :.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 FKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 ARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAF ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS58 ARLYYYWERDYRRALCRLSQAGARVTIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 LHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPGAPASPGAVPG :::::::::: . .:: CCDS58 LHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVLMDQHMGFLCN 190 200 210 220 230 240 >-- initn: 380 init1: 181 opt: 333 Z-score: 407.1 bits: 83.4 E(33420): 2.4e-16 Smith-Waterman score: 373; 39.9% identity (63.6% similar) in 173 aa overlap (20-190:201-353) 10 20 30 40 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLL ::.:.:.. : :.::::: .: .: CCDS58 WYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEV--ER-LDNGT 180 190 200 210 220 50 60 70 80 90 100 pF1KE2 WDTGVFRGQVYFEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CVAKLAEF : :. : .: :: : :.: . ...:::.::.:: . :.... : CCDS58 W---VLMDQ---------HMGFL---C-NELDPAQIYRVTWFISWSPCFSWGCAGEVRAF 230 240 250 260 270 110 120 130 140 150 160 pF1KE2 LSEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQ :.:. .: : : :::.: : . :..:: : .:::.:.:: :.:: :::..::: .: CCDS58 LQENTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCP 280 290 300 310 320 330 170 180 190 200 210 220 pF1KE2 FMPWYKFDENYAFLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGS :.:: ..:. : :. ::. CCDS58 FQPWDGLEEHSQALSGRLRAILQNQGN 340 350 >>CCDS13982.1 APOBEC3B gene_id:9582|Hs109|chr22 (382 aa) initn: 1378 init1: 1378 opt: 1378 Z-score: 1682.1 bits: 319.4 E(33420): 2.3e-87 Smith-Waterman score: 1378; 95.5% identity (97.0% similar) in 199 aa overlap (1-199:1-199) 10 20 30 40 50 60 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 FEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISA :.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 FKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 ARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAF ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS13 ARLYYYWERDYRRALCRLSQAGARVTIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 LHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPGAPASPGAVPG :::::::::: . .:: CCDS13 LHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVLMDQHMGFLCN 190 200 210 220 230 240 >-- initn: 352 init1: 181 opt: 392 Z-score: 478.7 bits: 96.7 E(33420): 2.5e-20 Smith-Waterman score: 392; 38.5% identity (65.4% similar) in 179 aa overlap (20-190:201-378) 10 20 30 40 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLL ::.:.:.. : :.:::::. . . .: CCDS13 WYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVL 180 190 200 210 220 230 50 60 70 80 90 100 pF1KE2 WDT--GVF--RGQVYFEPQY--HAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CV : : . ... . : :::. ::. . :: . ...:::.::.:: . :. CCDS13 MDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCA 240 250 260 270 280 290 110 120 130 140 150 160 pF1KE2 AKLAEFLSEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFV ... ::.:. .: : : :::.: : . :..:: : .:::.:.:: :.:: :::..:: CCDS13 GEVRAFLQENTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFV 300 310 320 330 340 170 180 190 200 210 220 pF1KE2 YNEGQQFMPWYKFDENYAFLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRS : .: :.:: ..:. : :. ::. CCDS13 YRQGCPFQPWDGLEEHSQALSGRLRAILQNQGN 350 360 370 380 >>CCDS33648.1 APOBEC3F gene_id:200316|Hs109|chr22 (373 aa) initn: 1125 init1: 952 opt: 1127 Z-score: 1375.9 bits: 262.7 E(33420): 2.6e-70 Smith-Waterman score: 1127; 82.6% identity (90.5% similar) in 190 aa overlap (1-190:1-189) 10 20 30 40 50 60 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVY :.:..:: .:::::::: :: :.::: :. .::::::: : : : :. .:::::: CCDS33 MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTK-GPSRPRLDAKIFRGQVY 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 FEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISA .:..:::::::::::::::::::::::::::::::::::::::::::.::::::::::: CCDS33 SQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 ARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAF ::::::::::::::::::::::::::::: ::::::::::::.::: ::::::::.:::: CCDS33 ARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAF 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 LHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPGAPASPGAVPG :::::::::: CCDS33 LHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFR 180 190 200 210 220 230 >-- initn: 694 init1: 694 opt: 694 Z-score: 847.4 bits: 164.9 E(33420): 7.2e-41 Smith-Waterman score: 694; 50.3% identity (73.2% similar) in 183 aa overlap (7-189:190-372) 10 20 30 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLC :::: :: :: .:.: :::. .::: CCDS33 VYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLC 160 170 180 190 200 210 40 50 60 70 80 90 pF1KE2 YEVKIKRGRSNLLWDTGVFRGQVYFEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTP . ... . .: . : ::::.:: : . ::: ::::::: . : ...::..::.: CCDS33 FTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSP 220 230 240 250 260 270 100 110 120 130 140 150 pF1KE2 CPDCVAKLAEFLSEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYC ::.:....::::..: ::.::: .:::::.:. ::...: ::: :: :.:: :..: :: CCDS33 CPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYC 280 290 300 310 320 330 160 170 180 190 200 210 pF1KE2 WENFVYNEGQQFMPWYKFDENYAFLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSW :::::::. . : :: . :. :: :.::: CCDS33 WENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE 340 350 360 370 220 230 240 250 pF1KE2 TRPRSTGSLGSSPGAPASPGAVPGKCVRSFRRTHT >>CCDS46709.1 APOBEC3D gene_id:140564|Hs109|chr22 (386 aa) initn: 1076 init1: 749 opt: 760 Z-score: 927.8 bits: 179.8 E(33420): 2.4e-45 Smith-Waterman score: 1133; 71.1% identity (80.9% similar) in 235 aa overlap (1-213:1-235) 10 20 30 40 50 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRG--- ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGPVL 10 20 30 40 50 60 60 70 80 90 100 pF1KE2 ---------QVYFEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFL .:::. . :::::::::::::.::: . :::::::::.:: ::.:...:: CCDS46 PKRQSNHRQEVYFRFENHAEMCFLSWFCGNRLPANRRFQITWFVSWNPCLPCVVKVTKFL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 SEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQF .::::::::::::::::: .::.: .: :: .:::::::::::.::::::::: :::: : CCDS46 AEHPNVTLTISAARLYYYRDRDWRWVLLRLHKAGARVKIMDYEDFAYCWENFVCNEGQPF 130 140 150 160 170 180 170 180 190 200 210 pF1KE2 MPWYKFDENYAFLHRTLKEILRL-------RIFSVAFTAAMRSCA---SWTWFLLCSWTR :::::::.::: :::::::::: .:: : ...:. :: : . CCDS46 MPWYKFDDNYASLHRTLKEILRNPMEAMYPHIFYFHFKNLLKACGRNESWLCFTMEVTKH 190 200 210 220 230 240 220 230 240 250 pF1KE2 PRSTGSLGSSPGAPASPGAVPGKCVRSFRRTHT CCDS46 HSAVFRKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEV 250 260 270 280 290 300 >-- initn: 587 init1: 558 opt: 564 Z-score: 688.6 bits: 135.5 E(33420): 5.1e-32 Smith-Waterman score: 564; 48.3% identity (76.8% similar) in 151 aa overlap (40-190:236-386) 10 20 30 40 50 60 pF1KE2 ERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVYFEPQYHAEM .. . .: .. ::::.:: : . ::: CCDS46 EAMYPHIFYFHFKNLLKACGRNESWLCFTMEVTKHHSAVFRKRGVFRNQVDPETHCHAER 210 220 230 240 250 260 70 80 90 100 110 120 pF1KE2 CFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISAARLYYYWER ::::::: . : ...::..::.:::.:....::::..: ::.::: .::: :.:. CCDS46 CFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLCYFWDT 270 280 290 300 310 320 130 140 150 160 170 180 pF1KE2 DYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAFLHRTLKEIL ::...:: ::: :: :::: :..:. ::.::::.. . : :: .. :. .:.: :.::: CCDS46 DYQEGLCSLSQEGASVKIMGYKDFVSCWKNFVYSDDEPFKPWKGLQTNFRLLKRRLREIL 330 340 350 360 370 380 190 200 210 220 230 240 pF1KE2 RLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPGAPASPGAVPGKCVRSFRRT . CCDS46 Q >>CCDS13983.1 APOBEC3C gene_id:27350|Hs109|chr22 (190 aa) initn: 676 init1: 676 opt: 710 Z-score: 871.0 bits: 168.3 E(33420): 3.5e-42 Smith-Waterman score: 710; 53.9% identity (74.3% similar) in 191 aa overlap (1-190:1-190) 10 20 30 40 50 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVK-IKRGRSNLLWDTGVFRGQV :::::::::. :: ::: .:.: :. ::::. :. ::: :: . : :::::.:: CCDS13 MNPQIRNPMKAMYPGTFYFQFKNLWEANDRNETWLCFTVEGIKR-RSVVSWKTGVFRNQV 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 YFEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTIS : . ::: ::::::: . : .:.::..::.:::::....::::..: ::.::: CCDS13 DSETHCHAERCFLSWFCDDILSPNTKYQVTWYTSWSPCPDCAGEVAEFLARHSNVNLTIF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 AARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYA .:::::. :...: ::: :. :.:::::.: :::::::::... : :: . :. CCDS13 TARLYYFQYPCYQEGLRSLSQEGVAVEIMDYEDFKYCWENFVYNDNEPFKPWKGLKTNFR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 FLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPGAPASPGAVP .:.: :.: :. CCDS13 LLKRRLRESLQ 180 190 >>CCDS13984.1 APOBEC3G gene_id:60489|Hs109|chr22 (384 aa) initn: 513 init1: 355 opt: 654 Z-score: 798.4 bits: 155.9 E(33420): 3.9e-38 Smith-Waterman score: 654; 49.0% identity (69.6% similar) in 204 aa overlap (1-199:1-203) 10 20 30 40 50 60 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVY :.:..:: .:::::::: :: :.::: :. .::::::: : : : :. .:::::: CCDS13 MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTK-GPSRPPLDAKIFRGQVY 10 20 30 40 50 70 80 90 100 110 pF1KE2 FEPQYHAEMCFLSWFCG-NQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTIS : .:: :: :. :: .: . ...::..::.:: :. .: ::.: :.::::: CCDS13 SELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 AARLYYYWERDYRRALCRLSQA--GAR--VKIMDYEEFAYCWENFVYNEGQQFMPWYKFD .:::::.:. ::..:: : : : : .:::.:.:: .:: .:::.. . : :: .. CCDS13 VARLYYFWDPDYQEALRSLCQKRDGPRATMKIMNYDEFQHCWSKFVYSQRELFEPWNNLP 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 ENYAFLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPGAPASP . : .:: : :::: . .:: CCDS13 KYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRR 180 190 200 210 220 230 >-- initn: 415 init1: 166 opt: 380 Z-score: 464.0 bits: 94.0 E(33420): 1.6e-19 Smith-Waterman score: 380; 36.7% identity (66.1% similar) in 177 aa overlap (20-190:205-380) 10 20 30 40 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLL ::.::: . :: :.:::::. .. . .: CCDS13 WNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVL 180 190 200 210 220 230 50 60 70 80 90 100 pF1KE2 WDT--GVFRGQVY----FEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAK . : . .:. : :::.:::. . .: . ...: :.::.:: .:. . CCDS13 LNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQE 240 250 260 270 280 290 110 120 130 140 150 160 pF1KE2 LAEFLSEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYN .:.:.:.. .:.: : .::.: : ...: :..:::...:: : :: .::..:: . CCDS13 MAKFISKNKHVSLCIFTARIYDDQGR-CQEGLRTLAEAGAKISIMTYSEFKHCWDTFVDH 300 310 320 330 340 350 170 180 190 200 210 220 pF1KE2 EGQQFMPWYKFDENYAFLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTG .: :.:: .::. : :. ::. CCDS13 QGCPFQPWDGLDEHSQDLSGRLRAILQNQEN 360 370 380 >>CCDS87027.1 APOBEC3D gene_id:140564|Hs109|chr22 (202 aa) initn: 923 init1: 522 opt: 530 Z-score: 651.0 bits: 127.7 E(33420): 6.3e-30 Smith-Waterman score: 903; 61.4% identity (79.7% similar) in 202 aa overlap (1-190:1-202) 10 20 30 40 50 60 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVY ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: : CCDS87 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGPVL 10 20 30 40 50 60 70 80 90 100 pF1KE2 ----------FEPQYH--AEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFL .:. : :: ::::::: . : ...::..::.:::.:....:::: CCDS87 PKRQSNHRQEVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 SEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQF ..: ::.::: .::: :.:. ::...:: ::: :: :::: :..:. ::.::::.. . : CCDS87 ARHSNVNLTIFTARLCYFWDTDYQEGLCSLSQEGASVKIMGYKDFVSCWKNFVYSDDEPF 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE2 MPWYKFDENYAFLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSS :: .. :. .:.: :.:::. CCDS87 KPWKGLQTNFRLLKRRLREILQ 190 200 >>CCDS41747.1 AICDA gene_id:57379|Hs109|chr12 (198 aa) initn: 372 init1: 195 opt: 413 Z-score: 508.3 bits: 101.2 E(33420): 5.6e-22 Smith-Waterman score: 413; 36.3% identity (64.8% similar) in 179 aa overlap (12-189:6-180) 10 20 30 40 50 60 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVY : : : .:.: :: :.::: :: . . ... : : .:.. CCDS41 MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNK-- 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 FEPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISA :.:. :: .. .: .:...:::.::.:: ::. ..:.:: .::..: : . CCDS41 --NGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFT 60 70 80 90 100 110 130 140 150 160 170 pF1KE2 ARLYYYWERDYR-RALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYA ::::. .: . ..: :: .::... :: .... :::..:: :. . : : . :: . CCDS41 ARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 FLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPGAPASPGAVP : : :..:: CCDS41 RLSRQLRRILLPLYEVDDLRDAFRTLGL 180 190 >>CCDS13981.1 APOBEC3A gene_id:200315|Hs109|chr22 (199 aa) initn: 317 init1: 172 opt: 379 Z-score: 466.8 bits: 93.6 E(33420): 1.1e-19 Smith-Waterman score: 379; 37.7% identity (62.8% similar) in 191 aa overlap (8-190:9-195) 10 20 30 40 50 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEV-KIKRGRS-NLLWDTGVFRG : . : : .::.: :: :.::::: .. : : .. : ... CCDS13 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 QV--YFEPQY--HAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CVAKLAEFLSEH :. . : :::. ::. . :: . ...:::.::.:: . :.... ::.:. CCDS13 QAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQEN 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 PNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQFMPW .: : : :::.: : . :..:: : .:::.:.:: :.:: .::..:: ..: :.:: CCDS13 THVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPW 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 YKFDENYAFLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPGA .::. : :. ::. CCDS13 DGLDEHSQALSGRLRAILQNQGN 180 190 >>CCDS54531.1 APOBEC3H gene_id:164668|Hs109|chr22 (182 aa) initn: 326 init1: 305 opt: 336 Z-score: 414.8 bits: 83.8 E(33420): 9e-17 Smith-Waterman score: 336; 32.6% identity (61.1% similar) in 190 aa overlap (9-188:1-180) 10 20 30 40 50 pF1KE2 MNPQIRNPMERMYRDTFYDNFENEPILYGRSY----TWLCYEVKIKRGRSNLLWDTGVFR : . .:: .:.:. : : : . :::.. . : . : CCDS54 MALLTAETFRLQFNNKRRLR-RPYYPRKALLCYQLTPQNGSTPT-------R 10 20 30 40 60 70 80 90 100 110 pF1KE2 GQVYFEPQY--HAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNV : ::: . :::.::.. . . : .:.:.: ...:.:: .:. .:..:.. : .. CCDS54 G--YFENKKKCHAEICFINEIKSMGLDETQCYQVTCYLTWSPCSSCAWELVDFIKAHDHL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE2 TLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQ-QFMPWY- .: : :.::::.: . ...: : . . :..: . ::: :::::: .: .: :. CCDS54 NLGIFASRLYYHWCKPQQKGLRLLCGSQVPVEVMGFPEFADCWENFVDHEKPLSFNPYKM 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE2 --KFDENYAFLHRTLKEILRLRIFSVAFTAAMRSCASWTWFLLCSWTRPRSTGSLGSSPG ..:.: ..: :..: CCDS54 LEELDKNSRAIKRRLERIKS 170 180 251 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Aug 1 17:04:05 2019 done: Thu Aug 1 17:04:05 2019 Total Scan time: 1.010 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]