FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1801, 313 aa 1>>>pF1KE1801 313 - 313 aa - 313 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1110+/-0.00068; mu= 12.8386+/- 0.042 mean_var=81.7359+/-16.097, 0's: 0 Z-trim(111.8): 11 B-trim: 215 in 1/51 Lambda= 0.141863 statistics sampled from 12677 (12687) to 12677 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.751), E-opt: 0.2 (0.39), width: 16 Scan time: 2.890 The best scores are: opt bits E(32554) CCDS7858.1 GAS2 gene_id:2620|Hs108|chr11 ( 313) 2118 442.4 2.1e-124 CCDS9079.1 GAS2L3 gene_id:283431|Hs108|chr12 ( 694) 1160 246.5 4.4e-65 CCDS76590.1 GAS2L3 gene_id:283431|Hs108|chr12 ( 590) 861 185.3 1e-46 CCDS11298.1 GAS2L2 gene_id:246176|Hs108|chr17 ( 880) 697 151.8 1.8e-36 CCDS63438.1 GAS2L1 gene_id:10634|Hs108|chr22 ( 454) 384 87.6 1.9e-17 CCDS74840.1 GAS2L1 gene_id:10634|Hs108|chr22 ( 681) 384 87.7 2.8e-17 >>CCDS7858.1 GAS2 gene_id:2620|Hs108|chr11 (313 aa) initn: 2118 init1: 2118 opt: 2118 Z-score: 2347.0 bits: 442.4 E(32554): 2.1e-124 Smith-Waterman score: 2118; 100.0% identity (100.0% similar) in 313 aa overlap (1-313:1-313) 10 20 30 40 50 60 pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNLLGKEITAETFMEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNLLGKEITAETFMEK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 LDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLSWC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 LDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLSWC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 RDLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEETLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 RDLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEETLS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 APSPSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCVERLSQGRYRVGEKILFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 APSPSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCVERLSQGRYRVGEKILFI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 RMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSPIQSKSPTLKDMNPDNYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 RMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSPIQSKSPTLKDMNPDNYL 250 260 270 280 290 300 310 pF1KE1 VVSASYKAKKEIK ::::::::::::: CCDS78 VVSASYKAKKEIK 310 >>CCDS9079.1 GAS2L3 gene_id:283431|Hs108|chr12 (694 aa) initn: 1154 init1: 497 opt: 1160 Z-score: 1282.0 bits: 246.5 E(32554): 4.4e-65 Smith-Waterman score: 1162; 56.7% identity (78.5% similar) in 307 aa overlap (3-296:19-319) 10 20 30 40 pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWL . :.: : ::::... ::..:.: ::::.::::.:::..:: CCDS90 MQPAIQVWFGEDLPLSPRSPLTP--RHGPGLANVCQYDEWIAVRHEATLLPMQEDLSIWL 10 20 30 40 50 50 60 70 80 90 100 pF1KE1 TNLLGKEITAETFMEKLDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPS ..::: .. :: ..:.::::.::::: ...:. : .. . :.:..:.::: .: : CCDS90 SGLLGIKVKAEKLLEELDNGVLLCQLIDVLQNMVKTC--NSEESGNFPMRKVPCKKDAAS 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 GSFFARDNTANFLSWCRDLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPP ::::::::::::: ::::.::::: :::::::::::.::.: :::::.:::..::::::: CCDS90 GSFFARDNTANFLHWCRDIGVDETYLFESEGLVLHKDPRQVYLCLLEIGRIVSRYGVEPP 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 GLIKLEKEIEQEETLSAPS-PSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCV :.::::::: :::: : : : : .: . . : .:::.:.:::::.: ..: . CCDS90 VLVKLEKEIELEETLLNTSGPEDSISIPKSCCRH--EELHEAVKHIAEDPPCSCSHRFSI 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 ERLSQGRYRVGEKILFIRMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSP : ::.::::.:.:::::::::.:::::::::::.:. :.:::.::::.::.. .. : CCDS90 EYLSEGRYRLGDKILFIRMLHGKHVMVRVGGGWDTLQGFLLKYDPCRILQFATLEQKILA 240 250 260 270 280 290 290 300 310 pF1KE1 IQ------------SKSPTLKDMNPDNYLVVSASYKAKKEIK .: ...: .::: CCDS90 FQKGVSNESVPDSPARTPQPPEMNPLSAVNMFQKQNSKPSVPVSIPKSKEKQGRPPGALV 300 310 320 330 340 350 >>CCDS76590.1 GAS2L3 gene_id:283431|Hs108|chr12 (590 aa) initn: 878 init1: 478 opt: 861 Z-score: 952.4 bits: 185.3 E(32554): 1e-46 Smith-Waterman score: 863; 60.4% identity (78.3% similar) in 217 aa overlap (93-296:1-215) 70 80 90 100 110 120 pF1KE1 NGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLSWCRD ..:.::: .: :::::::::::::: :::: CCDS76 MRKVPCKKDAASGSFFARDNTANFLHWCRD 10 20 30 130 140 150 160 170 180 pF1KE1 LGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEETLSAP .::::: :::::::::::.::.: :::::.:::..::::::: :.::::::: :::: CCDS76 IGVDETYLFESEGLVLHKDPRQVYLCLLEIGRIVSRYGVEPPVLVKLEKEIELEETLLNT 40 50 60 70 80 90 190 200 210 220 230 240 pF1KE1 S-PSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCVERLSQGRYRVGEKILFIR : : : : .: . . : .:::.:.:::::.: ..: .: ::.::::.:.:::::: CCDS76 SGPEDSISIPKSCCRH--EELHEAVKHIAEDPPCSCSHRFSIEYLSEGRYRLGDKILFIR 100 110 120 130 140 250 260 270 280 pF1KE1 MLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSPIQ------------SKSP :::.:::::::::::.:. :.:::.::::.::.. .. : .: ...: CCDS76 MLHGKHVMVRVGGGWDTLQGFLLKYDPCRILQFATLEQKILAFQKGVSNESVPDSPARTP 150 160 170 180 190 200 290 300 310 pF1KE1 TLKDMNPDNYLVVSASYKAKKEIK .::: CCDS76 QPPEMNPLSAVNMFQKQNSKPSVPVSIPKSKEKQGRPPGALVPASSLKGGNLGSMSVRSK 210 220 230 240 250 260 >>CCDS11298.1 GAS2L2 gene_id:246176|Hs108|chr17 (880 aa) initn: 547 init1: 293 opt: 697 Z-score: 768.3 bits: 151.8 E(32554): 1.8e-36 Smith-Waterman score: 697; 41.7% identity (69.4% similar) in 271 aa overlap (30-292:28-293) 10 20 30 40 50 60 pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNLLGKEITAETFMEK : : :::::: :: .: : .: : .:.. CCDS11 MSQPAGGRRKPRTLGPPVCSIRPFKSSEQYLEAMKEDLAEWLRDLYGLDIDAANFLQV 10 20 30 40 50 70 80 90 100 110 pF1KE1 LDNGALLCQLAETMQEKFKESM-DANKPTKNLPLKKI--PCKTSAPSGSFFARDNTANFL :..: .::: :... . . .: ....:. .. :. .: :.: ::::..::. CCDS11 LETGLVLCQHANVVTDAALAFLAEAPAQAQKIPMPRVGVSCNGAAQPGTFQARDNVSNFI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 SWCR-DLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQE .::: ..:..:. .::.: :::.:. ..: :::::::: : :.:: : :..::.:::.: CCDS11 QWCRKEMGIQEVLMFETEDLVLRKNVKNVVLCLLELGRRAWRFGVAAPTLVQLEEEIEEE 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 --ETLSAPSPSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCVERLSQGRYRVG . :. : :.::: . . ::. :. . : :: .: . ..:.:.:::: CCDS11 VRRELALPPPDPSPPAPPRRQPCHFRNLDQMVQSLVSH--CTCPVQFSMVKVSEGKYRVG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 EK--ILFIRMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSPIQSKSPTLK .. ..:::.:.: ::::::::::.:.. :: :::::: ..:. : : .. .: .. CCDS11 DSNTLIFIRILRN-HVMVRVGGGWDTLGHYLDKHDPCRCTSLSHKPG--SFLKPPAPPVQ 240 250 260 270 280 290 300 310 pF1KE1 DMNPDNYLVVSASYKAKKEIK CCDS11 HEVRVQDGPSQTQPTMTISRSQSPPPPVDWKTYTSSDRRLRPPTPSSPRPRRERGAGTGA 300 310 320 330 340 350 >>CCDS63438.1 GAS2L1 gene_id:10634|Hs108|chr22 (454 aa) initn: 536 init1: 176 opt: 384 Z-score: 426.5 bits: 87.6 E(32554): 1.9e-17 Smith-Waterman score: 605; 41.0% identity (69.3% similar) in 261 aa overlap (30-270:23-275) 10 20 30 40 50 pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNL--LGKEITAETFM :: . :::::: ::. : :: .. :. CCDS63 MADPVAGIAGSAAKSVRPFRSSEAYVEAMKEDLAEWLNALYGLGLPGGGDGFL 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 EKLDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLS : .:. ::: :... : . .. : .:.... .. .. .: :::.::::.:.:.. CCDS63 TGLATGTTLCQHANAVTEAAR-ALAAARPARGVAFQA---HSVVP-GSFMARDNVATFIG 60 70 80 90 100 120 130 140 150 160 170 pF1KE1 WCR-DLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEE ::: .::: :. .::.: :::.:. . : :::::..: .:: :. : :...:.:::.: CCDS63 WCRVELGVPEVLMFETEDLVLRKNEKSVVLCLLEVARRGARLGLLAPRLVQFEQEIEREL 110 120 130 140 150 160 180 190 200 210 220 pF1KE1 TLSAPSPS------------PSPSSKSSGKKST-GNL--LDDAVKRISEDPPCKCPNKFC . :.:. :.:.. . : . : ..: ::. :..: : ::..: CCDS63 RAAPPAPNAPAAGEDTTETAPAPGTPARGPRMTPSDLRNLDELVREILGR--CTCPDQFP 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE1 VERLSQGRYRVGEK--ILFIRMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGK . ..:.:.::::.. ..:.:.:.. ::::::::::.:. :: :::::: CCDS63 MIKVSEGKYRVGDSSLLIFVRVLRS-HVMVRVGGGWDTLEHYLDKHDPCRCSSTAHRPPQ 230 240 250 260 270 280 290 300 310 pF1KE1 TSPIQSKSPTLKDMNPDNYLVVSASYKAKKEIK CCDS63 PRVCTFSPQRVSPTTSPRPASPVPGSERRGSRPEMTPVSLRSTKEGPETPPSSSSSSLSV 290 300 310 320 330 340 >>CCDS74840.1 GAS2L1 gene_id:10634|Hs108|chr22 (681 aa) initn: 536 init1: 176 opt: 384 Z-score: 423.8 bits: 87.7 E(32554): 2.8e-17 Smith-Waterman score: 605; 41.0% identity (69.3% similar) in 261 aa overlap (30-270:23-275) 10 20 30 40 50 pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNL--LGKEITAETFM :: . :::::: ::. : :: .. :. CCDS74 MADPVAGIAGSAAKSVRPFRSSEAYVEAMKEDLAEWLNALYGLGLPGGGDGFL 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 EKLDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLS : .:. ::: :... : . .. : .:.... .. .. .: :::.::::.:.:.. CCDS74 TGLATGTTLCQHANAVTEAAR-ALAAARPARGVAFQA---HSVVP-GSFMARDNVATFIG 60 70 80 90 100 120 130 140 150 160 170 pF1KE1 WCR-DLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEE ::: .::: :. .::.: :::.:. . : :::::..: .:: :. : :...:.:::.: CCDS74 WCRVELGVPEVLMFETEDLVLRKNEKSVVLCLLEVARRGARLGLLAPRLVQFEQEIEREL 110 120 130 140 150 160 180 190 200 210 220 pF1KE1 TLSAPSPS------------PSPSSKSSGKKST-GNL--LDDAVKRISEDPPCKCPNKFC . :.:. :.:.. . : . : ..: ::. :..: : ::..: CCDS74 RAAPPAPNAPAAGEDTTETAPAPGTPARGPRMTPSDLRNLDELVREILGR--CTCPDQFP 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE1 VERLSQGRYRVGEK--ILFIRMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGK . ..:.:.::::.. ..:.:.:.. ::::::::::.:. :: :::::: CCDS74 MIKVSEGKYRVGDSSLLIFVRVLRS-HVMVRVGGGWDTLEHYLDKHDPCRCSSTAHRPPQ 230 240 250 260 270 280 290 300 310 pF1KE1 TSPIQSKSPTLKDMNPDNYLVVSASYKAKKEIK CCDS74 PRVCTFSPQRVSPTTSPRPASPVPGSERRGSRPEMTPVSLRSTKEGPETPPRPRDQLPPH 290 300 310 320 330 340 313 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 15:12:28 2016 done: Sun Nov 6 15:12:28 2016 Total Scan time: 2.890 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]