FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1957, 421 aa
1>>>pF1KSDA1957 421 - 421 aa - 421 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.2811+/-0.000771; mu= 5.1217+/- 0.046
mean_var=172.8237+/-34.798, 0's: 0 Z-trim(114.5): 15 B-trim: 0 in 0/52
Lambda= 0.097560
statistics sampled from 15088 (15097) to 15088 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.777), E-opt: 0.2 (0.464), width: 16
Scan time: 3.860
The best scores are: opt bits E(32554)
CCDS45890.1 C2CD4C gene_id:126567|Hs108|chr19 ( 421) 2784 403.5 2e-112
CCDS32259.1 C2CD4B gene_id:388125|Hs108|chr15 ( 364) 504 82.5 7.2e-16
CCDS32258.1 C2CD4A gene_id:145741|Hs108|chr15 ( 369) 498 81.7 1.3e-15
CCDS44224.1 C2CD4D gene_id:100191040|Hs108|chr1 ( 353) 383 65.5 9.5e-11
>>CCDS45890.1 C2CD4C gene_id:126567|Hs108|chr19 (421 aa)
initn: 2784 init1: 2784 opt: 2784 Z-score: 2131.7 bits: 403.5 E(32554): 2e-112
Smith-Waterman score: 2784; 100.0% identity (100.0% similar) in 421 aa overlap (1-421:1-421)
10 20 30 40 50 60
pF1KSD MRKTNMWFLERLRGSGENGAARGVGSEAGDKASKGPLYSNVLTPDKIPDFFIPPKLPSGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 MRKTNMWFLERLRGSGENGAARGVGSEAGDKASKGPLYSNVLTPDKIPDFFIPPKLPSGP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD AEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQIESAEDW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 AEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQIESAEDW
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALAQVGSPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALAQVGSPG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD AGRRRAAAKANGGDGGPREAGGALMSPGRYFSGGESDTGSSAESSPFGSPLLSRSVSLLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 AGRRRAAAKANGGDGGPREAGGALMSPGRYFSGGESDTGSSAESSPFGSPLLSRSVSLLK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD GFAQDSQAKVSQLRHSVGRHGSLSADDSTPDASPGSRRRLTRRAPPEPGPESGQARGEHT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GFAQDSQAKVSQLRHSVGRHGSLSADDSTPDASPGSRRRLTRRAPPEPGPESGQARGEHT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD VHVGPRGSVRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSINCCVGLCLVPGKLQKQRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VHVGPRGSVRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSINCCVGLCLVPGKLQKQRS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD TIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDTLLGEKELPLTSLLPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDTLLGEKELPLTSLLPF
370 380 390 400 410 420
pF1KSD L
:
CCDS45 L
>>CCDS32259.1 C2CD4B gene_id:388125|Hs108|chr15 (364 aa)
initn: 580 init1: 184 opt: 504 Z-score: 398.3 bits: 82.5 E(32554): 7.2e-16
Smith-Waterman score: 589; 35.9% identity (56.7% similar) in 404 aa overlap (26-418:10-362)
10 20 30 40 50 60
pF1KSD MRKTNMWFLERLRGSGENGAARGVGSEAGDKASKGPLYSNVLTPDKIPDFFIPPKLPSGP
: ::..: : : ...::::..::.: :::.::.
CCDS32 MRLLEKLCSSAAGSSAPK-PAFAKVLTPNRIPEFCIPPRLPA--
10 20 30 40
70 80 90 100 110 120
pF1KSD AEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQIESAEDW
: : :. . .:: .: . :::: .:: . . . ::
CCDS32 ----------PCTLESPIRAAA---------VPRRCAAESDLWPRAADEDA----GRTDW
50 60 70
130 140 150 160 170 180
pF1KSD LSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALAQVGSPG
::..:.:.::: .:...:.::: : :::::::::::. .:.:
CCDS32 --------DPRSQAALSLPHLPRVRTTYGFCALLESPHTRRKESLL---------LGGPP
80 90 100 110 120
190 200 210 220 230
pF1KSD AGRRRAAAKANGGDGGPREAGGALMSP---GRYFS---GGESDTGSSAESSPFGSPLLSR
: : :: .. :: ::: :.: .: : :: .. ..: ::
CCDS32 APRPRA--HSCGGGGGPDAPLGTLCGPRGPGPATPAAPGGPRLPQDALAAGPRRCRLLRV
130 140 150 160 170
240 250 260 270 280 290
pF1KSD SVSLL-KGFAQDSQAKVSQLRH-SVGRHGSLS-ADDSTPDASPGSRRRLTRRAPPEPGPE
.:: ... . .....: : : . : . .: .:.: :. ::: ::
CCDS32 PDGLLSRALRAGRSRRLARVRSVSSGNEDEERRAGSESPARAPSSSP-LSSRAP---LPE
180 190 200 210 220 230
300 310 320 330 340 350
pF1KSD SGQARGEHTVHVGPRG-SVRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSINCCVGLCL
.:.: :: .: : ..:: ::: : :::..:: ::.:. :.. : ..: :
CCDS32 RLEAKG--TVALGRAGDALRLAAEYCPGTRRLRLRLLRAESLFGGAPGPRAVRCRLSLVL
240 250 260 270 280 290
360 370 380 390 400
pF1KSD VP-GKLQKQRSTIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDTLLGE
: : . : :..: ::. :..:: ::::. ::.::.:.:. ..: . : :::.
CCDS32 RPPGTARWQCSAVVGRSRKASFDQDFCFDGLSEDEVRRLAVRVKARDEGRGRDRGRLLGQ
300 310 320 330 340 350
410 420
pF1KSD KELPLTSLLPFL
:: : .::
CCDS32 GELSLGALLLL
360
>>CCDS32258.1 C2CD4A gene_id:145741|Hs108|chr15 (369 aa)
initn: 576 init1: 193 opt: 498 Z-score: 393.7 bits: 81.7 E(32554): 1.3e-15
Smith-Waterman score: 544; 34.4% identity (52.0% similar) in 427 aa overlap (6-418:1-367)
10 20 30 40 50
pF1KSD MRKTNMWFLERLRGSGENGAARG----VGSEAGDKASKGPLYSNVLTPDKIPDFFIPPKL
:: ::::: . : : : : :. .::::::.::.: :::.:
CCDS32 MWCLERLRLGPECLRRSGDWLLPGRARGAKSRTTAACANVLTPDRIPEFCIPPRL
10 20 30 40 50
60 70 80 90 100 110
pF1KSD PSGPAEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQIES
::: ::: .: .. : . . .
CCDS32 --------------------------------MPRLA--LAALRNSWVEEAG--MDEGAG
60 70
120 130 140 150 160 170
pF1KSD AEDWLSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALAQV
:: ::..:.:.::: .:...:.::: : :::::::::::. .
CCDS32 RTDW--------DPRSQAALSLPHLPRVRTAYGFCALLESPHTRRKESLL---------L
80 90 100 110 120
180 190 200 210 220 230
pF1KSD GSPGAGRRRAAAKANGGDGGPREAGGALMSPGRYFSGGESDTGSSAESSPFGSPLLSR--
:.: : : :: .. :: ::: :.: : : . : . .. . : . : :
CCDS32 GGPPAPRPRA--HTYGGGGGPDALLGTLRVP-R--APGPATPAAPGCPRPPQDALARRPR
130 140 150 160 170
240 250 260 270 280
pF1KSD SVSLLK---GFAQDSQAKVSQLRHSVGRHGSLSADDSTPDASPGSRRRLTRRAPPE---P
. ::. :. . . . : . : : . .:. :. : : .:: :
CCDS32 GCRLLRVPDGLLSRALRAGRSRRLTRVRSVSSGNEDKERRAGSQSPARAPSTSPPSSRVP
180 190 200 210 220 230
290 300 310 320 330 340
pF1KSD GPESGQARGEHTVHVGPRG-SVRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSINCCVG
:: .:.: :: .: : ..:: ::: : .:::..:: ::. :...: ..
CCDS32 FPERLEAEG--TVALGRAGDALRLAAEYCPGTGRLRLRLLRAESPAGGAPGPRAVSCRLS
240 250 260 270 280 290
350 360 370 380 390 400
pF1KSD LCLVP-GKLQKQRSTIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDTL
: : : : .: ::.: ::. :..:: ::::. ::.::.:.:. ..: . .: :
CCDS32 LVLRPPGTALRQCSTVVGRSRKASFDQDFCFDGLSEDEVRRLAVRVKARDEGRGRERGRL
300 310 320 330 340 350
410 420
pF1KSD LGEKELPLTSLLPFL
::. :: : .::
CCDS32 LGQGELSLGALLLL
360
>>CCDS44224.1 C2CD4D gene_id:100191040|Hs108|chr1 (353 aa)
initn: 646 init1: 234 opt: 383 Z-score: 306.5 bits: 65.5 E(32554): 9.5e-11
Smith-Waterman score: 538; 35.0% identity (52.4% similar) in 431 aa overlap (6-421:1-336)
10 20 30 40 50
pF1KSD MRKTNMWFLERLR---GSGENGAARGVGSEAGDKASKGPLYS---NVLTPDKIPDFFIPP
::.::. :..: .: . .. . . . :: : ::::::.::.:::::
CCDS44 MWLLEKAGYKVGAAEPAARWAPSGLFSKRRAPGPPTSACPNVLTPDRIPQFFIPP
10 20 30 40 50
60 70 80 90 100 110
pF1KSD KLPSGPAEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQI
.::. :. .:.: :: :::
CCDS44 RLPD------------PG-------GAVP----------------------AARRHVA--
60 70
120 130 140 150 160 170
pF1KSD ESAEDWLSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALA
..: . :.:. :.:.: :::::::.:::::. : :
CCDS44 -----------------GRGLPATCSLPHLAGREGWAFLPESPHTRRRESLFHGPPPAPA
80 90 100 110
180 190 200 210 220 230
pF1KSD QVGSPGAGRRRAAAKANGGDGGPREAGGALMSPGRYFSGGESDTGSSAESSPFGSPLLSR
: :.: : .. . : . .:::.:: .:::::::
CCDS44 G-GLPAAQSRLHVSAPDL----------------RLCRAPDSDTASSPDSSPFGSPR---
120 130 140 150
240 250 260 270 280 290
pF1KSD SVSLLKGFAQDSQAKVSQLRHSVGRHGSLSADD-STPDASPGSRRRLTRRAPPEPGPE--
:.. :. :.: ::: . :. :.:: : :: .:: .
CCDS44 -----PGLG----------RRRVSRPHSLSPEKASSADTSPHSPRRAGPPTPPLFHLDFL
160 170 180 190 200
300 310 320 330 340
pF1KSD SGQARG--EHTVHVGPRGS-VRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSIN--CCV
: : : ....::::. .:: .::.:: .:::..:..:::: : . :::
CCDS44 CCQLRPTRESVLRLGPRGGQLRLSTEYQAGPGRLRLRLVSAEGLPRPRSRPGSGGGGCCV
210 220 230 240 250 260
350 360 370 380 390 400
pF1KSD GLCLVPG-KLQKQRSTIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDT
: : : . ..:.: .:: : :.:::::::::::: .. .:: ::...:..:.::.
CCDS44 VLRLRPRVRPREQQSRVVKCSANPIFNEDFFFDGLGPPDLAARSLRAKVLDRGAGLRRDV
270 280 290 300 310 320
410 420
pF1KSD LLGEKELPLTSLLPFL
:::: : :: .::: :
CCDS44 LLGECETPLIALLPPLGGGLGPGSSLAPTHLSL
330 340 350
421 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 07:48:37 2016 done: Thu Nov 3 07:48:37 2016
Total Scan time: 3.860 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]