FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5684, 575 aa 1>>>pF1KE5684 575 - 575 aa - 575 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.3616+/-0.000871; mu= 0.9857+/- 0.052 mean_var=223.9199+/-46.509, 0's: 0 Z-trim(114.4): 23 B-trim: 305 in 2/48 Lambda= 0.085709 statistics sampled from 14962 (14976) to 14962 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.781), E-opt: 0.2 (0.46), width: 16 Scan time: 3.560 The best scores are: opt bits E(32554) CCDS12110.1 APBA3 gene_id:9546|Hs108|chr19 ( 575) 3901 495.2 9.3e-140 CCDS6630.1 APBA1 gene_id:320|Hs108|chr9 ( 837) 1160 156.4 1.3e-37 CCDS45197.1 APBA2 gene_id:321|Hs108|chr15 ( 737) 1131 152.7 1.5e-36 CCDS10022.1 APBA2 gene_id:321|Hs108|chr15 ( 749) 1131 152.7 1.5e-36 >>CCDS12110.1 APBA3 gene_id:9546|Hs108|chr19 (575 aa) initn: 3901 init1: 3901 opt: 3901 Z-score: 2622.6 bits: 495.2 E(32554): 9.3e-140 Smith-Waterman score: 3901; 100.0% identity (100.0% similar) in 575 aa overlap (1-575:1-575) 10 20 30 40 50 60 pF1KE5 MDFPTISRSPSGPPAMDLEGPRDILVPSEDLTPDSQWDPMPGGPGSLSRMELDESSLQEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MDFPTISRSPSGPPAMDLEGPRDILVPSEDLTPDSQWDPMPGGPGSLSRMELDESSLQEL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 VQQFEALPGDLVGPSPGGAPCPLHIATGHGLASQEIADAHGLLSAEAGRDDLLGLLHCEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VQQFEALPGDLVGPSPGGAPCPLHIATGHGLASQEIADAHGLLSAEAGRDDLLGLLHCEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 CPPSQTGPEEPLEPAPRLLQPPEDPDEDSDSPEWVEGASAEQEGSRSSSSSPEPWLETVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CPPSQTGPEEPLEPAPRLLQPPEDPDEDSDSPEWVEGASAEQEGSRSSSSSPEPWLETVP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 LVTPEEPPAGAQSPETLASYPAPQEVPGPCDHEDLLDGVIFGARYLGSTQLVSERNPPTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LVTPEEPPAGAQSPETLASYPAPQEVPGPCDHEDLLDGVIFGARYLGSTQLVSERNPPTS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 TRMAQAREAMDRVKAPDGETQPMTEVDLFVSTKRIKVLTADSQEAMMDHALHTISYTADI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TRMAQAREAMDRVKAPDGETQPMTEVDLFVSTKRIKVLTADSQEAMMDHALHTISYTADI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 GCVLVLMARRRLARRPAPQDHGRRLYKMLCHVFYAEDAQLIAQAIGQAFAAAYSQFLRES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GCVLVLMARRRLARRPAPQDHGRRLYKMLCHVFYAEDAQLIAQAIGQAFAAAYSQFLRES 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 GIDPSQVGVHPSPGACHLHNGDLDHFSNSDNCREVHLEKRRGEGLGVALVESGWGSLLPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GIDPSQVGVHPSPGACHLHNGDLDHFSNSDNCREVHLEKRRGEGLGVALVESGWGSLLPT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 AVIANLLHGGPAERSGALSIGDRLTAINGTSLVGLPLAACQAAVRETKSQTSVTLSIVHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AVIANLLHGGPAERSGALSIGDRLTAINGTSLVGLPLAACQAAVRETKSQTSVTLSIVHC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 PPVTTAIIHRPHAREQLGFCVEDGIICSLLRGGIAERGGIRVGHRIIEINGQSVVATPHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PPVTTAIIHRPHAREQLGFCVEDGIICSLLRGGIAERGGIRVGHRIIEINGQSVVATPHA 490 500 510 520 530 540 550 560 570 pF1KE5 RIIELLTEAYGEVHIKTMPAATYRLLTGQEQPVYL ::::::::::::::::::::::::::::::::::: CCDS12 RIIELLTEAYGEVHIKTMPAATYRLLTGQEQPVYL 550 560 570 >>CCDS6630.1 APBA1 gene_id:320|Hs108|chr9 (837 aa) initn: 1486 init1: 958 opt: 1160 Z-score: 788.5 bits: 156.4 E(32554): 1.3e-37 Smith-Waterman score: 1746; 51.8% identity (73.8% similar) in 568 aa overlap (46-575:280-837) 20 30 40 50 60 70 pF1KE5 MDLEGPRDILVPSEDLTPDSQWDPMPGGPGSLSRMELDESS--LQELVQQFEALPGDLVG :.: . ::... . : :..: : : CCDS66 EKEAEFAPYPRMDSYEQEEDIDQIVAEVKQSMSSQSLDKAAEDMPEAEQDLERPPTPAGG 250 260 270 280 290 300 80 90 100 110 120 pF1KE5 -P-SPG-GAPCPLHIATGH---GLASQEIADAHGLLSAEAGRDDLLGLLHCE-ECPPSQT : ::: :: . :.: : :.:. . . . : .: .. . . . : CCDS66 RPDSPGLQAPAGQQRAVGPAGGGEAGQRYSKEKRDAISLAIKDIKEAIEEVKTRTIRSPY 310 320 330 340 350 360 130 140 150 160 170 pF1KE5 GPEEPLEPAPRLLQ---PPEDPDE----DSDSPEWVEGASAEQEGSRSSSSSPEPWLETV :.:: :: . : : .: :. :.::: :.:. :..:::.: .: CCDS66 TPDEPKEPIWVMRQDISPTRDCDDQRPMDGDSPS--PGSSSPL-GAESSSTSLHP----- 370 380 390 400 410 420 180 190 200 210 220 230 pF1KE5 PLVTPEEPPAGAQSPETLASYPAPQEVPGPCDHEDLLDGVIFGARYLGSTQLVSERNPPT : : .. .: ..:::.:. ::::::: :::.::.::.: :::::::.:...: CCDS66 --SDPVEASTNKESRKSLASFPTYVEVPGPCDPEDLIDGIIFAANYLGSTQLLSDKTPSK 430 440 450 460 470 240 250 260 270 280 pF1KE5 STRMAQAREAMDRVK-----------APDGETQPMTEVDLFVSTKRIKVLTADSQEAMMD ..:: ::.::..:.: ::.::.:::::::::.::.:::::.::.::.::: CCDS66 NVRMMQAQEAVSRIKMAQKLAKSRKKAPEGESQPMTEVDLFISTQRIKVLNADTQETMMD 480 490 500 510 520 530 290 300 310 320 330 340 pF1KE5 HALHTISYTADIGCVLVLMARRRLARRPA--------PQDHGRRLYKMLCHVFYAEDAQL : :.:::: :::: ..:::::::. : . :.. :.: :::.:::: .::::: CCDS66 HPLRTISYIADIGNIVVLMARRRMPRSNSQENVEASHPSQDGKRQYKMICHVFESEDAQL 540 550 560 570 580 590 350 360 370 380 390 pF1KE5 IAQAIGQAFAAAYSQFLRESGIDP---SQVGVHPSPGACHLHNGDLDHFSNSDNCREVHL :::.:::::..::..::: .::.: :: .. ..: :: :::.:.::..: . CCDS66 IAQSIGQAFSVAYQEFLRANGINPEDLSQKEYSDLLNTQDMYNDDLIHFSKSENCKDVFI 600 610 620 630 640 650 400 410 420 430 440 450 pF1KE5 EKRRGEGLGVALVESGWGSLLPTAVIANLLHGGPAERSGALSIGDRLTAINGTSLVGLPL ::..:: :::..:::::::.:::..:::..::::::.:: :.:::.. .::::::::::: CCDS66 EKQKGEILGVVIVESGWGSILPTVIIANMMHGGPAEKSGKLNIGDQIMSINGTSLVGLPL 660 670 680 690 700 710 460 470 480 490 500 510 pF1KE5 AACQAAVRETKSQTSVTLSIVHCPPVTTAIIHRPHAREQLGFCVEDGIICSLLRGGIAER ..::. .. :.:. : :.::.::::::..:.:: : :::: :..::::::.::::::: CCDS66 STCQSIIKGLKNQSRVKLNIVRCPPVTTVLIRRPDLRYQLGFSVQNGIICSLMRGGIAER 720 730 740 750 760 770 520 530 540 550 560 570 pF1KE5 GGIRVGHRIIEINGQSVVATPHARIIELLTEAYGEVHIKTMPAATYRLLTGQEQPVYL ::.::::::::::::::::::: .:...:..: ::.:.:::::: :::::.::::::. CCDS66 GGVRVGHRIIEINGQSVVATPHEKIVHILSNAVGEIHMKTMPAAMYRLLTAQEQPVYI 780 790 800 810 820 830 >>CCDS45197.1 APBA2 gene_id:321|Hs108|chr15 (737 aa) initn: 1668 init1: 934 opt: 1131 Z-score: 769.9 bits: 152.7 E(32554): 1.5e-36 Smith-Waterman score: 1666; 47.7% identity (69.4% similar) in 614 aa overlap (5-575:142-737) 10 20 30 pF1KE5 MDFPTISRSPSGPPAMDLEGPRDILVPSEDLTPD : : .: : . . :: .: :: CCDS45 EGMDCNGEEYLAHSAHPVDTDECQEAVEEWTDSAGPH-PHGHEAEGSQDY--------PD 120 130 140 150 160 40 50 60 70 80 pF1KE5 SQWDPMPGG-PGSLSRMELDES----SLQELVQQFEALPGDLVGPSPGGAPCPLHIATGH .: :.: :. : . .:. . .: :.. : . : . :: : .. : CCDS45 GQL-PIPEDEPSVLEAHDQEEDGHYCASKEGYQDY--YPEEANGNT--GAS-PYRLRRGD 170 180 190 200 210 90 100 110 120 130 140 pF1KE5 G-LASQEIADAHGLLSAEAGRDDLLGLLHCEECPPS---QTGPEEPLEPAPRLLQPPEDP : : .:: : ... .. .. : : . :::. .: : . . .: CCDS45 GDLEDQE-EDIDQIVAEIKMSLSMTSITSASEASPEHGPEPGPEDSVEACPPI-KASCSP 220 230 240 250 260 270 150 160 170 180 pF1KE5 DEDSDSPEWV------EGASAEQEGSRSSSSSPEPWL----ETV--PLVTPEE------- .. :. . . . :.: . .. .:: : : : : :.. CCDS45 SRHEARPKSLNLLPEAKHPGDPQRGFKPKTRTPEERLKWPHEQVCNGLEQPRKQQRSDLN 280 290 300 310 320 330 190 200 210 220 230 240 pF1KE5 -PPAGAQSPET--LASYPAPQEVPGPCDHEDLLDGVIFGARYLGSTQLVSERNPPTSTRM : . . ::: .::.:. :::::. :::.::.::.: :::::::.::::: . :: CCDS45 GPVDNNNIPETKKVASFPSFVAVPGPCEPEDLIDGIIFAANYLGSTQLLSERNPSKNIRM 340 350 360 370 380 390 250 260 270 280 290 300 pF1KE5 AQAREAMDRVKAPDGETQPMTEVDLFVSTKRIKVLTADSQEAMMDHALHTISYTADIGCV ::.::..::: .:..: .::::::.::.:::::.::.::.::::::.:::: :::: . CCDS45 MQAQEAVSRVKNSEGDAQTLTEVDLFISTQRIKVLNADTQETMMDHALRTISYIADIGNI 400 410 420 430 440 450 310 320 330 340 350 pF1KE5 LVLMARRRLARRPAPQD---------HGRRLYKMLCHVFYAEDAQLIAQAIGQAFAAAYS .:::::::. : : :: .:.. :::.:::: .::::::::.:::::..::. CCDS45 VVLMARRRMPRS-ASQDCIETTPGAQEGKKQYKMICHVFESEDAQLIAQSIGQAFSVAYQ 460 470 480 490 500 510 360 370 380 390 400 410 pF1KE5 QFLRESGIDP---SQVGVHPSPGACHLHNGDLDHFSNSDNCREVHLEKRRGEGLGVALVE .::: .::.: :: .. ...: :: :::::.::.:..:::..:: :::..:: CCDS45 EFLRANGINPEDLSQKEYSDIINTQEMYNDDLIHFSNSENCKELQLEKHKGEILGVVVVE 520 530 540 550 560 570 420 430 440 450 460 470 pF1KE5 SGWGSLLPTAVIANLLHGGPAERSGALSIGDRLTAINGTSLVGLPLAACQAAVRETKSQT :::::.:::...::...:::: ::: :::::.. .::::::::::::.::. .. :.:: CCDS45 SGWGSILPTVILANMMNGGPAARSGKLSIGDQIMSINGTSLVGLPLATCQGIIKGLKNQT 580 590 600 610 620 630 480 490 500 510 520 530 pF1KE5 SVTLSIVHCPPVTTAIIHRPHAREQLGFCVEDGIICSLLRGGIAERGGIRVGHRIIEING .: :.:: ::::::..:.:: . :::: :..::::::.:::::::::.::::::::::: CCDS45 QVKLNIVSCPPVTTVLIKRPDLKYQLGFSVQNGIICSLMRGGIAERGGVRVGHRIIEING 640 650 660 670 680 690 540 550 560 570 pF1KE5 QSVVATPHARIIELLTEAYGEVHIKTMPAATYRLLTGQEQPVYL :::::: : .:.. :... ::.:.:::::: .::::::: :.:. CCDS45 QSVVATAHEKIVQALSNSVGEIHMKTMPAAMFRLLTGQETPLYI 700 710 720 730 >>CCDS10022.1 APBA2 gene_id:321|Hs108|chr15 (749 aa) initn: 1602 init1: 934 opt: 1131 Z-score: 769.8 bits: 152.7 E(32554): 1.5e-36 Smith-Waterman score: 1631; 47.8% identity (69.3% similar) in 603 aa overlap (28-575:157-749) 10 20 30 40 50 pF1KE5 MDFPTISRSPSGPPAMDLEGPRDILVPSEDLTPDSQWDPMPGG-PGSLSRMELDES- :.: ::.: :.: :. : . .:. CCDS10 HPVDTDECQEAVEEWTDSAGPHPHGHEAEGSQDY-PDGQL-PIPEDEPSVLEAHDQEEDG 130 140 150 160 170 180 60 70 80 90 100 110 pF1KE5 ---SLQELVQQFEALPGDLVGPSPGGAPCPLHIATGHG-LASQEIADAHGLLSAEAGRDD . .: :.. : . : . :: : .. : : : .:: : ... . CCDS10 HYCASKEGYQDY--YPEEANGNT--GAS-PYRLRRGDGDLEDQE-EDIDQIVAEIKMSLS 190 200 210 220 230 120 130 140 150 160 pF1KE5 LLGLLHCEECPPS---QTGPEEPLEPAPRLLQPPEDPDEDSDSPEWV------EGASAEQ . .. : : . :::. .: : . . .:.. :. . . . : CCDS10 MTSITSASEASPEHGPEPGPEDSVEACPPI-KASCSPSRHEARPKSLNLLPEAKHPGDPQ 240 250 260 270 280 290 170 180 190 200 pF1KE5 EGSRSSSSSPEPWL----ETV--PLVTPEE--------PPAGAQSPET--LASYPAPQEV .: . .. .:: : : : : :.. : . . ::: .::.:. : CCDS10 RGFKPKTRTPEERLKWPHEQVCNGLEQPRKQQRSDLNGPVDNNNIPETKKVASFPSFVAV 300 310 320 330 340 350 210 220 230 240 250 pF1KE5 PGPCDHEDLLDGVIFGARYLGSTQLVSERNPPTSTRMAQAREAMDRVK------------ ::::. :::.::.::.: :::::::.::::: . :: ::.::..::: CCDS10 PGPCEPEDLIDGIIFAANYLGSTQLLSERNPSKNIRMMQAQEAVSRVKRMQKAAKIKKKA 360 370 380 390 400 410 260 270 280 290 300 310 pF1KE5 APDGETQPMTEVDLFVSTKRIKVLTADSQEAMMDHALHTISYTADIGCVLVLMARRRLAR .:..: .::::::.::.:::::.::.::.::::::.:::: :::: ..:::::::. : CCDS10 NSEGDAQTLTEVDLFISTQRIKVLNADTQETMMDHALRTISYIADIGNIVVLMARRRMPR 420 430 440 450 460 470 320 330 340 350 360 pF1KE5 RPAPQD---------HGRRLYKMLCHVFYAEDAQLIAQAIGQAFAAAYSQFLRESGIDP- : :: .:.. :::.:::: .::::::::.:::::..::..::: .::.: CCDS10 S-ASQDCIETTPGAQEGKKQYKMICHVFESEDAQLIAQSIGQAFSVAYQEFLRANGINPE 480 490 500 510 520 530 370 380 390 400 410 420 pF1KE5 --SQVGVHPSPGACHLHNGDLDHFSNSDNCREVHLEKRRGEGLGVALVESGWGSLLPTAV :: .. ...: :: :::::.::.:..:::..:: :::..:::::::.:::.. CCDS10 DLSQKEYSDIINTQEMYNDDLIHFSNSENCKELQLEKHKGEILGVVVVESGWGSILPTVI 540 550 560 570 580 590 430 440 450 460 470 480 pF1KE5 IANLLHGGPAERSGALSIGDRLTAINGTSLVGLPLAACQAAVRETKSQTSVTLSIVHCPP .::...:::: ::: :::::.. .::::::::::::.::. .. :.::.: :.:: ::: CCDS10 LANMMNGGPAARSGKLSIGDQIMSINGTSLVGLPLATCQGIIKGLKNQTQVKLNIVSCPP 600 610 620 630 640 650 490 500 510 520 530 540 pF1KE5 VTTAIIHRPHAREQLGFCVEDGIICSLLRGGIAERGGIRVGHRIIEINGQSVVATPHARI :::..:.:: . :::: :..::::::.:::::::::.::::::::::::::::: : .: CCDS10 VTTVLIKRPDLKYQLGFSVQNGIICSLMRGGIAERGGVRVGHRIIEINGQSVVATAHEKI 660 670 680 690 700 710 550 560 570 pF1KE5 IELLTEAYGEVHIKTMPAATYRLLTGQEQPVYL .. :... ::.:.:::::: .::::::: :.:. CCDS10 VQALSNSVGEIHMKTMPAAMFRLLTGQETPLYI 720 730 740 575 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:50:06 2016 done: Tue Nov 8 05:50:06 2016 Total Scan time: 3.560 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]